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TUMORASSOZIIERTES ANTIGEN (B345) , GEKENNZEICHNET DURCH EINE AMINOSAURESEQUENZ 
WIE IN SEQ. ID. NO. 4 

5 Die Erf indung bezieht sich auf die Chemotherapie von 
Tumorerkrankungen . 

Normale Korperzellen unterliegen einem strikt geordneten 
System, das das Wachstum, die Zellteilung und das 
Absterben bestimmter Zellen kontrolliert . So teilen sich 

10 Korperzellen einer erwachsenen Person nur dann, wenn sie 
tote Zellen ersetzen oder eine Verletzung verheilen 
miissen. Krebszellen dagegen wachsen unkontrolliert 
weiter, sie akkumulieren und bilden einen Tumor. 
Erreicht der Tumor eine kritische Grofie, konnen 

15 Krebszellen uber die Blutbahnen oder das Lymphsystem 

auch in andere Bereiche des Korpers transportiert werden 
und dort Kolonien bilden (Metastasen) . Nicht alle Tumore 
sind kanzerogen, denn benigne Tumore metastasieren nicht 
und sind daher meistens nicht lebensgef ahrlich, da sie 

20 chirurgisch entfernt werden konnen. Detailliertere 

Informationen zu diesem Thema sowie den weiter unten 
diskutierten Aspekten der Tumorentstehung geben fplgende 
Publikationen: Rauscher und Vogt, 1997; Kastan, 1997; 
Hesketh, 1995; Pusztai # Lewis und Yap, 1995. 

25 Die Transformation einer gesunden Zelle in eine 

Krebszelle kann durch eine ganze Reihe von Faktoren, wie 
Umwelteinf lusse, Strahlung, Viren oder chemische 
Reagenzien ausgelost werden. Bei der Tumorentwicklung 
spielen jedoch auch epigenetische (Methylierungen, 
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Acetylierungen und veranderte Chromatinstruktur) und 
genetische Modif ikationen (Punkt mutation, Deletion, 
Amplif ikation, Translokation) eine bedeutendende Rolle. 

Mutationen in kodierenden Bereichen von Genen, die an 
5 der Regulation der Zell-Prolif eration beteiligt sind, 
konnen an der Oberfuhrung einer normalen Zelle in eine 
Tumorzelle beitragen, da die transf ormierte Zelle 
Wachstumsvorteile gegeniiber ihrer gesunden Nachbarzelle 
hat . 

10 Krebs entsteht also durch eine Ansammlung von vererbten 
oder erworbenen Mutationen in kritischen Protoonkogenen 
oder Tumorsuppressorgenen. 

Die Zellprolif eration steht unter der Kontrolle 
verschiedener Gensysteme, wahrend Produkte von Onkogenen 

15 an der Signalvermittlung von Zelloberf lache zum Zellkern 
beteiligt sind, geleiten cyclinabhangige Proteinkinase 
und ihre Inhibitoren die Zelle durch den Zellzyklus. 
Nicht selten werden Storungen in der Synthese dieser 
Proteine bei Tumor zellen gefunden. Eine zentrale Rolle 

20 spielt dabei das p53 -Protein. 

Proteine vom Typ des RB-Proteins regulieren die 
Verf ugbarkeit entscheidender Transkriptionsf aktoren. 

Die in Tumorgeweben hochregulierten Gene stellen'meist 
den Ausgangspunkt fur weitere detaillierte Analysen dar 
25 und da Proteine verschiedenster Funktionen 

hochexprimiert werden, ist der Ansatz fur therapeutische 
Interventionen sehr vielseitig. Es ist daher das Ziel 
der Krebsforschung weitere neue Zielmolektile (sog. 
^Targets'" ) fur therapeutische Interventionen zu f inden, 
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die dann fur eine gezielte Therapie mit geringen 
Nebenwirkungen benutzt werden konnen. 

In erster Linie gilt es daher molekulare Veranderungen 
zwischen Normalgewebe und Tumor auf dem Niveau der 
5 Genexpression ( „Transkriptionslevel" ) aufzudecken, die 
einerseits neue Targets identif izieren sollen und 
andererseits fur die Entwicklung bzw. das Auffinden von 
Substanzen zur Hemmung von Fehlfunktionen herangezogen 
werden konnen. 

10 Eine ganze Reihe verschiedenster Methoden zur 

Identif izierung und Charakterisierung von neuen Targets, 
die den Ausgangspunkt fur die Entwicklung von neuen 
Therapeutika darstellen, basieren auf der Erstellung 
dif f erenzieller mRNA Transkriptionsprof ile zwischen 

15 Tumoren und Normalgeweben. Dazu zahlen die 

dif f erenzielle Hybridisierung, die Erstellung von 
Subtraktions-cDNA-Banken ("representational difference 
analysis"; Hubank und Schatz, 1994; Diatchenko et al . , 
1996) und der Einsatz der DNA-Chip Technologie oder der 

20 SAGE-Methode (Velculescu et al., 1995). 

Neben immuntherapeutischen Ansatzen kommt der gezielten 
Chemotherapie eine wesentliche Rolle bei der Behandlung 
von Krebs zu. Unter Chemotherapie versteht man die 
Verabreichung von Substanzen, die durch Eingriff in 

25 Stof fwechsel, Signal transdukt ion und 

Zellteilungsvorgange maligner Zellen entweder 
zytostatisch oder zytotoxisch-zytolytisch wirken. 
Chemotherapeutika lassen sich auf Grund der 
Beeinf lussung von spezifischen Targets in der 

30 Tumorzelle, nach Art der zellularen Interaktion und der 
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Wechselwirkung mit einer bestimmten Zellzyklusphase, in 
verschiedene Kategorien unterteilen. 

Die Art der Krebsbehandlung hangt vom Tumorstadium ab, 
entscheidend ist dabei, ob bereits Metastasen vorhanden 
5 sind und wie weit diese im Korper verbreitet sind. Die 
Applikation von Zellgiften zur Krebsbehandlung ist, 
neben operativen Maftnahmen und der Strahlentherapie, ein 
integraler Bestandteil der heutigen Therapiekonzepte in 
der Onkologie. 

10 Im wesentlichen gibt es zwei Hauptziele der 

Chemotherapie: In erster Linie ist es die Heilung von 
Krebs; das bedeutet, dass der Turaor v verschwindet und 
nicht mehr auftritt. Ist eine Heilung aus 
verschiedensten Griinden nicht mehr moglich, versucht man 

15 den Tumor in seinem Wachstum und seiner Ausbreitung 
einzuschranken bzw. zu kontrollieren. 

Prinzipiell entfalten Substanzen, die bei der 
Chemotherapie Anwendung finden, ihre Wirkung bei alien 
sich teilenden Zellen. Tumorzellen zeigen jedoch eine 
20 hohere Empf indlichkeit gegenuber Chemotherapeutika als 
gesunde Zellen, da hauptsachlich stark prolif erierende 
Zellen angegriffen werden. 

Jedes Gewebe haft ein charakteristisches Wachstums- 
verhalten, das Zellteilung, Wachstumsstillstand, 
25 Dif f erenzierung und Alterung umfasst und durch interne 
und externe Faktoren beeinflusst und reguliert wird. 

Viele der heute eingesetzten zytotoxischen 
Chemotherapeutika wirken nur bei prolif erierenden Zellen 
(nicht in der GO-Phase der Zellteilung) . Dabei werden 
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allerdings sowohl Normal- als auch Krebszellen 
attackiert. Die Zerstorung von normalen Zellen kann zu 
starken Nebenef f ekten fiihren; z.B. Zerstorung der 
Blutzellen-produzierenden Gewebe des Knochenmarks 
5 (Myelosuppression) . 

Chemotherapeutika werden je nachdem, wie sie spezifische 
Substanzen innerhalb der Tumorzelle beeinf lussen, mit 
welchen zellularen Prozessen die Medikamente 
interagieren und welche Zellzyklusphase sie 
10 beeinf lussen, in verschiedene Kategorien unterteilt. 

Diese Inf ormationen sind fur Onkologen notwendig fur die 
Entscheidung welche Praparate bei der Therapie 
miteinander kombiniert werden konnen. 

Die in Tumorgeweben hochregulierten Gene stellen somit 
15 potentielle neue Zielstrukturen dar und da Proteine 
verschiedenster Funktionen hochexprimiert werden, ist 
der Ansatz fur therapeutische Interventionen sehr 
vielseitig. 

Es ist daher das Ziel der Krebsforschung, weitere neue 
20 Targets fur therapeutische Interventionen zu finden, die 
dann fur eine gezielte Therapie mit - verglichen mit 
derzeitig eingesetzten Therapeutika - geringeren 
Nebenwirkungen benutzt werden konnen. 

In Tumorgeweben hochregulierte Gene stellen 
25 Angriff spunkte und somit potentielle Zielstrukturen 
(„Targets") fur die Chemotherapie dar. 



Aufgabe der vorliegenden Erfindung war es, ein neues, 
bevorzugt von Tumorzellen exprimiertes Protein 
bereitzustellen, das ein ZielmolekUl fur die 
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Intervention mittels chemotherapeutischer Methoden 
darstellt . 

Diese Aufgabe wurde geldst, indem zunSchst mittels RDA 
(^representational difference analysis'') zwischen einer 
5 Lungen-Adenokarzinom-Zelllinie (A549) und 

Normal lungengewebe eine cDNA-Substraktionsbibliothek 
hergestellt wurde. Zur Selektion der im Tumor 
iaberexprimierten Antigene wurden anschlieBend die 
erhaltenen cDNA-Klone sequenziert und mit in Datenbanken 

10 verfugbaren Sequenzen verglichen. Unter den dabei 

annotierten Genen befanden sich 321 unbekannte, zu denen 
grofctenteils ESTs ("expressed sequence tags") -Eintrage 
in der Datenbank exist ierten. Nach einer weiteren 
qualitativen PCR- Analyse in cDNA-Bibliotheken von 

15 kritischen Normalgeweben und immunprivilegierten Geweben 
sowie detaillierteren Datenbankrecherchen wurde die 
Anzahl der Kandidatenklone auf 59 eingeschrankt , deren 
ESTs nicht aus kritischen Normalgeweben stammen. 

Diese Klone wurden auf Incyte DNA Chips gespottet und 

2 0 mit einer ganzen Reihe von Tumorgeweben und 

Normalgeweben als Referenz hybridisiert . Das mRNA 
Expressionsprof il von EST Fragmenten, die in 
Krebsgeweben und Normalgeweben different iell exprimiert 
werden und zu einem noch unbekannten Gen geh6ren, wurde 
25 mit unterschiedlichen Methoden verif iziert . 

Die Lange der Transkripte wurde mittels Northern blot 
Analyse bestimmt und das Expressionsmuster in 
verschiedenen Zellsystemen durch quantitative PCR exakt 
charakterisiert . Nur unbekannte Gene bzw. ESTs mit 

3 0 tumorspezif ischen Expressionsprof il wurden 
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weiterverf olgt und einer "full length Klonierung" 
unterworfen. Potentielle ORFs ("open reading frames") 
werden in die entsprechende Aminosauresequenz 
umgewandelt und zur moglichen Funktionsvorhersage 
5 mittels in silico Strategien analysiert. 

Die humane B34 5- cDNA wurde kloniert, die in einem ersten 
. Klonierungsansatz erhaltene Sequenz ist in SEQ ID NO:l 
dargestellt. Die Sequenzanalyse der in diesem Ansatz 
klonierten humanen B345-CDNA zeigte einen durchgehenden 

10 offenen Leserahmen von Position 215 bis Position 2461 
(exklusive Stopcodon) , der, auf Nukleotid- und 
Proteinebene, in den bekannten Sequenzen der Datenbanken 
keine Homologie oder Identitat aufweist. Aus den aus 
Northern Blot Experimenten gewonnenen Daten ist zu 

15 schlieflen, dass das B345-Transkript eine Lange von ca. 
6,5 kb hat. In einem ersten Ansatz wurde als klonierter 
Bereich eine B345-CDNA mit 5897 bp (exklusive polyA- 
Region) , erhalten, wobei das Vorhandensein eines 
Polyadenylationssignals und des PolyA-Tails am 3'-Ende 

20 der Sequenz auf die Vollst&ndigkeit der cDNA in diesem 
Bereich hindeutete. Aufgrund der Tatsache, dass im 
5 '-Bereich der klonierten cDNA von Position 1 bis 214 
kein durchgehender Leserahmen aufschien, wurde zunachst 
angenommen, dass es sich bei dem ATG an Position 215, 

25 die auch zu 75% einer Kozak Translationinitiationsstelle 
(ACCATGT) (Kozak, 1987) entspricht, urn das Startkodon 
von B345 handelt. 

In einem weiteren Klonierungsansatz wurden mittels einer 
molekularbiologischen Standardmethode, und zwar mittels 
30 sog. „Promotor Finder DNA Walking", . zusatzliche 
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Informationen iiber die weiter stromaufwarts liegende 
Sequenz von B345 gewonnen. 

Somit wurde die in dem ersten Klonierunsversuch 
erhaltene B345-Sequenz (SEQ ID NO:l) in der 5 v Region 
5 erweitert. Der Transkriptionsstart konnte unter 

Anwendung der Primer Extension Analyse genau lokalisiert 
werden und liegt bei Position 201 (SEQ ID NO: 3) . Durch 
wiederholte Sequenz ierungen auch in der 3 "Region wurde, 
im Vergleich zur in SEQ ID NO:l dargestellten Sequenz, 

10 eine zusatzliche Base an Position 2,430 gefunden, die zu 
einer Leserasterverschiebung fiihrt und somit das 
Stoppcodon von Position 2729 auf 2791 verschiebt. Die 
erhaltene cDNA (SEQ ID NO: 3) besitzt einen offenen 
Leserahmen, der fur ein potentielles Protein mit einer 

15 Lange von 836 Aminosauren (SEQ ID NO: 4) kodiert. Die 

. Translationsinitiationsstelle an Position 283 entspricht 
etwa zu 70% einer Kozak-Konsensussequenz. 

Die Promotorregion 200bp upstream der mutmafi lichen 
Transkriptionsstartstelle enthalt weder eine TATA noch 
20 eine CCAAT box, jedoch eine eindeutige GC-box, welche 
eine Bindungsstelle des SP1 Proteins darstellt. Die 
Tatsache , dass der GC Gehalt in der 5 'Region liber 60% 
ist, deutet auf ein CpG Island hin (Bird, 1986) . 

Die resultierende primMre Aminosauresequenz von B345 ist 
25 in SEQ ID NO: 4 gezeigt. Die Analyse des Hydrophilizitats 
Plots der Aminosauresequenz zeigt, dass das B345 Protein 
zwei charakteristische hydrophobe Domanen aufweist, die 
ein Signalpeptid und eine helikale Transmembrandomane 
darstellen (Fig. 6) . Diese polarisierte Struktur deutet 



WO 02/04508 



9 



PCT/EP01/07705 



darauf hin, dass es sich bei B345 urn ein integrales 
Membraneprotein handelt. 

Die extrazellulare Domane lalit auf die Existenz von 
definitiv einer, gegebenenf alls drei, CUB Domanen 
5 schliefien. CUB Domanen kommen bei verschiedenen, meist 
wahrend der Embryonalentwicklung regulierten Proteinen 
vor. Eine kiirzlich erschienen'e Publikation (Gerstein et 
al., 2000) demonstriert, da& CUB Domanen enthaltende 
Proteine die am ausgepragtesten dif f erenziell 

10 regulierten Proteine in C. elegans sind. Da Gene, die 
eine Schlusselrolle in der Embryonalentwicklung haben, 
entsprechende Funktionen, z.B. in der Zellteilung, der 
Zellproliferation oder Signaliibertragung, in Krebs 
ausfuhren, kann angenommen werden, dass eine 

15 Oberexpression von B345 in Zellen eine VerSnderung in 
den Eigenschaften der Substratadhasion oder der 
extrazellularen Matrix bewirkt. Das B345 Protein weist 
12 potentielle N-Glycosylierungsstellen auf, die in der 
mutmaftlichen extrazellularen Domane zu finden sind. 

2 0 Aufgrund seiner Aminosauresequenz ist anzunehmen, dass 
das B345-Protein eine ft-Sheet Sekundarstruktur 
ausbildet, da sich CUB Domanen bekanntlich als 
fc-Sandwich falten. 

Die intrazellulare Domane (Bereich 691-836) weist keine 
25 signif ikanten Homologien auf. Der gesamte C-Terminus 

zeigt jedoch eine Identitat (82%) uber 124 AminosSuren 
mit einem EST (Acc No. AW063026) aus humanen 
Eierstockkrebs Zellen. 

Ausgehend von den Funktionen anderer CUB Domanen 
30 enthaltender Proteine kann gefolgert werden, da& das 
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B345 Transmembranprotein in der Kommunikation, der 
Interaktion und/oder der Signaltransduktion mit 
extrazellularen Komponenten oder Liganden eine Rolle 
spieit. Ferner sind die Daten der Expressionsanalyse ein 
5 stairkes Indiz dafiir, dass B345 beim metastatischen 

Prozess von Krebs, insbesondere Dickdarrakrebs, beteiligt 
ist . 

Fur die Aufklarung der physiologischen Funktion und der 
Rolle von B345 bei der Metastasierung sind folgende 
10 Untersuchungsmethoden geeignet: 

Zunachst werden Zelllinien, vorzugsweise humane 
Zelllinien identif iziert , z.B. mittels TaqMan PCR, die 
B345 nicht endogen exprimieren. Die Zellen werden mit 
einem Plasmid, das die B345-Sequenz enthalt, 

15 transf iziert und B345 exprimiert. Anderungen in der 

Morphologie und/oder dem Migrationsverhalten, das z.B. 
mittels Softagar Assay (Hamburger und Salmon, 1977) oder 
Migrationsassay (Liaw et al; 1995) der B345 
exprimierenden Zellen gegenuber den nicht-transf izierten 

20 Zellen deuten auf eine Rolle von B345 in dem dafur 

verantwort lichen biologischen Prozess hin. Dies ist ein 
deutlicher Hinweis auf eine Beteiligung von B345 an der 
Interaktion von Tumorzellen untereinander und/oder mit 
der extrazellularen Matrix und somit auf eine Funktion 

25 bei der Metastasierung. 

Alternativ bzw. zusatzlich zu dieser Funktionsanalyse 
wird in einem komplementaren Ansatz die Expression von 
B345 in Zellen, die dieses Protein endogen exprimieren, 
unterdrtickt, urn ebenfalls die etwaige Anderungen in 
30 Morphologie und/oder Migrationsverhalten f estzustellen. 
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Aufierdem wird gegebenenf alls untersucht, ob 
Proteinkomponenten exist ieren, die mit B345 inter- oder 
extrazellular interagieren (z.B. mittels Yeast Two 
Hybrid System (Fields und Song, 1989) . 

5 Die Erfindung betrifft somit in einem ersten Aspekt ein 
tumorspezif isches Polypeptid mit der Bezeichnung B345, 
mit der in SEQ ID NO: 4 angegebenen Aminosauresequenz 
oder ein Polypeptid, das von einem Polynukleotid kodiert 
wird, das unter stringenten Bedingungen mit einem 
10 Polynukleotid der in SEQ ID NO: 3 dargestellten Sequenz 
oder einer Teilsequenz davon hybridisiert , sowie davon 
abgeleitete Proteinf ragmente oder Peptide, 

In einem weiteren Aspekt betrifft die vorliegende 
Erfindung ein isoliertes DNA-Molekul , kodierend fur das 
15 tumorspezif ische Polypeptid der Bezeichung B345. 

Bevorzugt ist das erf indungsgemafce DNA-Molekul ein 
Polynukleotid der in SEQ ID NO: 3 dargestellten Sequenz 
oder ein Fragment davon oder ein DNA-Molekul, das mit 
einem DNA-Molekul der in SEQ ID NO: 3 dargestellten 
20 Sequenz oder einer Teilsequenz davon unter stringenten 
Bedingungen hybridisiert, oder ein Fragment davon.' 

Unter ^stringenten Bedingungen'' wird z.B. verstanden: 
Inkubation uber Nacht bei 65 °C - 68 °C mit 6xSSC (lxSSC = 
. 150 mM NaCl, 15 mM Tri-Natriumcitrat) , SxDenhardt's 
25 Losung, 0.2%SDS, 50 ug/ml Lachsspermien-DNA, daran 

anschlieflend Waschen zweimal 30 min mit 2xSSC, 0.1% SDS 
bei 65°C, einmal 30 min mit 0.2xSSC, 0.1% SDS bei 65°C 
und gegebenenf alls abschlieflendes Spiilen mit O.lxSSC, 
0.1%SDS bei 65°C, oder aquivalente Bedingungen. 
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Die erf indungsgemaften DNA Molekule kodieren fur 
(Poly) peptide der Bezeichnung B345 mit der in SEQ ID 
NO: 4 dargestellten Aminosauresequenz bzw. fur davon 
abgeleitete Proteinf ragmente oder Peptide; damit sind 
5 DNA Molekule bzw. Fragmente mitumf asst, die durch die 
Degeneration des genetischen Codes Abweichungen von der 
. in SEQ ID NO: 3 dargestellten Sequenz aufweisen 

In einer Ausf uhrungsf orm der Erfindung betrifft die 
Erfindung ein isoliertes DNA-Molekul der in SEQ ID NO: 3 
0 dargestellten Sequenz oder ein Fragment davon, oder ein 
DNA-Molekul, das mit einem DNA-Molekul der in SEQ ID 
NO: 3 dargestellten oder mit einer Teilsequenz davon 
hybridisiert, kodierend fur das naturliche 
B345-Polypeptid bzw* fur ein Fragment davon. 

5 Die B345-DNA-Molekule konnen in einer sog. DNA-Vakzine 
fur die Immuntherapie von Tumoren verwendet werden. 

Dabei konnen die B345-DNA-Molekiile der Erfindung, 
vorzugsweise in rekombinanter Form als Plasmide, direkt 
oder als Bestandteil eines rekombinanten Virus, oder 
0 Bakteriums verabreicht werden. Prinzipiell kann jede 
gentherapeutische Methode fur die Immuntherapie von 
Krebs auf Basis von DNA ("DNA-Vakzine") auf B345-DNA 
angewendet werden, und zwar sowohl in vivo als auch 
ex vivo. 

5 Beispiele fur die in vivo Verabreichung sind die direkte 
Injektion von "nackter" DNA, entweder intramuskular oder 
mittels Gen-Pistole ("gene gun") von der sich gezeigt 
hat, daft sie zur Bildung von CTLs gegen Tumorantigene 
fuhrt. Beispiele fur rekombinante Organismen sind 

0 Vaccinia Virus, Adenovirus oder Listeria monocytogenes 
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(eine Obersicht wurde von Coulie, 1997, gegeben) . 
Desweiteren kdnnen synthetische Trager fur 
Nukleinsauren, wie kationische Lipide, Mikrospharen, 
Mikrokugelchen oder Liposomen fiir die in vivo 

5 Verabreichung von Nukleinsaure-Molekiilen, kodierend fiir 
B345-Peptid verwendet werden. Verschiedene Hilfsstoffe, 
die die Immunantwort verstarken, konnen mitverabreicht 
werden,. z.B. Zytokine, entweder in Form von Proteinen 
oder daftir kodierenden Plasmiden. Die Applikation kann 

0 gegebenenf alls mit physikalischen Methoden, z.B. 
Elektroporation, kombiniert werden. 

. Ein Beispiel far die ex vivo Verabreichung ist die 

Transfektion dendritischer Zellen, wie von Tuting, 1997, 
beschrieben, oder anderer APCs,.die als zellulare 
5 Krebsvakzine zur Anwendung kommen. 

Die vorliegende Erfindung betrifft somit in einem 
weiteren Aspekt die Verwendung von Zellen, die B345 
exprimieren, entweder von sich aus oder, in 
gegebenenf alls modif izierter Form, nach Transfektion mit 
0 der entsprechend kodierenden Sequenz, fur die 
Herstellung einer Krebsvakzine. 

Alternativ zur natiirlichen B345-CDNA bzw. Fragmenten 
davon k6nnen modif izierte Derivate verwendet werden. 
Diese umfassen Sequenzen mit Modif ikationen, die fiir ein 

5 Protein (fragment) bzw. Peptide mit starkerer 

Immunogenitat kodieren, wobei fur die Modif ikationen auf 
DNA-Ebene dieselben Oberlegungen gelten wie fiir die oben 
beschriebenen Peptide. Eine weitere Art der Modif ikation 
ist die Aneinanderreihung zahlreicher Sequenzen, 

0 kodierend fiir immunologisch relevante Peptide, nach Art 
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einer Perlenschnur ( "string-of -beads" ; Toes et al . , 
1997) . Die Sequenzen konnen auch durch Anfiigung von 
Hilf selementen modifiziert werden, z.B. Funktionen, die 
eine effizientere Abgabe und Prozessierung des 

5 Immunogens gewahrleisten (Wu et al., 1995). 
Beispielsweise kann durch Anfiigen einer 
Lokalisierungssequenz in das endoplasmatische Retikulum 
("ER targeting sequence") die Prozessierung und damit 
die Presentation und letztlich die Immunogenitat des 

0 Antigens erhoht werden. 

Die vorliegende Erfindung betrifft in einem weiteren 
Aspekt ein rekombinantes DNA-Molekiil, das B345-DNA 
enthalt, z.B. verbunden mit einer regulatorischen 
DNA-Sequenz, insbesondere einer heterologen 
5 regulatorischen DNA-Sequenz, z.B. einem Promoter oder 
Enhancer . 

Die Erfindung betrifft in einem weiteren Aspekt 
Antikorper gegen B345 bzw. Fragmente davon. Polyklonale 
Antikorper konnen in herkommlicher Weise durch 
0 Immunisierung von Tieren, insbesondere Kaninchen, 

mittels Injektion des B 345-Antigens bzw. Fragmenten 
davon, und anschliefcender Reinigung des Immunglobulins 
erhalten werden. 

Monoklonale anti-B345-Antikdrper konnen nach 
15 Standardprotokollen gemaB dem von Kohler und Milstein, 
1975, beschriebenen Prinzip gewonnen werden, indem 
Tiere, insbesondere Mause, immunisiert, anschliefiend 
antikorperproduzierende Zellen der immunisierten Tiere 
itnmortalisiert werden, z.B. durch Fusion mit 
\0 Myelomzellen, und der Oberstand der erhaltenen Hybridome 
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mittels immunologischer Standard-Assays auf monoklonale 
anti-B345-Antikorper gescreent wird. Fiir den 
therapeutischen oder diagnostischen Einsatz im Menschen 
konnen diese tierischen Antikorper gegebenenf alls auf 
5 herkommliche Weise chimerisiert (Neuberger et al., 1984; 
Boulianne et al . , 1984) oder humanisiert (Riechmann et 
al., 1988; Graziano et al . , 1995) werden. 

Humane monoklonale anti-B345-Antikorper (f ragmente) 
konnen auch von sog. "Phage Display Libraries" (Winter 
10 et al., 1994; Griffiths et al-, 1994; Kruif et al . , 

1995; Mc Guiness et al . , 1996) und mittels transgener 
Tiere (Bruggemann et al., 1996; Jakobovits et al., 1995) 
gewonnen werden. 

Die erf indungsgemaGen anti-B345-Antikorper konnen in 
15 immunhistochemischen Analysen fur diagnostische Zwecke 
eingesetzt werden, oder als Therapeutikum in der 
Krebstherapie . (Ein Beispiel fur die erfolgreiche 
Anwendung eines monoklonalen Antikorpers in der 
Krebstherapie ist Herceptin; ein Antikorper gegen das 
20 Proto-Onkogen HER2. Herceptin kann in Brustkrebs- 

Patienten angewendet werden, die eine Oberexpression von 
HER2 aufweisen.) 

In einem weiteren Aspekt betrifft die Erfindung die 
Verwendung von B345-spezif ischen Antikorpern, urn 

25 beliebige Substanzen selektiv zu bzw. in einen Tumor zu 
bringen, der B345 exprimiert. Beispiele fur solche 
Substanzen sind zytotoxische Agenzien oder radioaktive 
Nuklide, deren Wirkung darin besteht, den Tumor Vorort 
zu schadigen. Aufgrund der relativ tumorspezif ischen 

30 Expression von B345 sind dabei nur geringe 
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Nebenwirkungen zu erwarten. In einem weiteren Aspekt 
konnen mit Hilfe von B345-Antik6rpern Substanzen zur 
Sichtbarmachung von Tumoren, die B345 exprimieren', 
herangezogen werden. Dies ist fur die Diagnose und die 
5 Bewertung des Therapieverlauf s von Nutzen. 

Therapeutische und diagnostische Anwendungen von 
Antikorpern, die fur anti-B345~Antikorper in Frage 
kommen, sind in der WO 95/33771 beschrieben. 

Das Protein der Bezeichnung B345 gemaft der vorliegenden 
10 Erfindung und die davon abgeleiteten Proteinf ragmente, 
Peptide bzw. Peptid-Aquivalente oder Peptidomimetika 
konnen in der Krebstherapie eingesetzt werden, z. B. urn 
eine Immunantwort gegen Tumorzellen zu induzieren, die 
die entsprechenden Antigen-Determinanten exprimieren. 
15 Vorzugsweise werden sie fur die Therapie von 

B345-positiven Tumoren verwendet, insbesondere beim 
Lungen- und Kolonkarzinom. 

B345 bzw. Peptide, Peptid-Aquivalente und 
Peptidomimetika konnen fur die Iramuntherapie von Krebs 
20 eingesetzt werden, wie z.B. in der WO 00/73438 

beschrieben, auf deren Offenbarung hiermit Bezug 
genommen wird. 

Es ist bekannt, dass tumorassoziierte Antigene 

* 

tumorspezif ische Mutationen aufweisen konnen, die zu : 
25 einer immunologischen Unterscheidung zwischen Tumor und 
Normalgewebe beitragen (Mandruzzato et al., 1997; Hogan 
et al., 1998; Gaudi et al., 1999; Wolfel et al.,1994). 
Urn das Vorhandensein tumorspezif ischer B3 4 5 -Mutationen 
festzustellen, wird, zweckmaMg mit Hilfe von Sonden aus 
30 der erf indungsgemafien isolierten cDNA, die B345-CDNA aus 
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einem oder mehreren unterschiedlichen Tumoren kloniert 
und die erhaltenen Sequenzen mit Normalgewebs-B345-cDNA 
verglichen. Es werden Versuche durchgef tihrt , die zeigen 
sollen, ob Tumor-B345-Peptide aus einem gegenuber 
5 Normalgewebs-B345 mutierten Sequenzabschnitt im 
Vergleich zu Normalgewebs-B345-Peptiden aus dem 
entsprechenden Abschnitt eine verstarkte Immunogenitat 
aufweisen. Urn zu bestatigen, dass etwaige Mutationen 
tumorspezif isch sind, konnen Antikorper gegen diese 
10 Bereiche generiert und Tumorzellen auf Expression von 
moglichen Mutationen untersucht werden. 

Die vorliegende Erfindung betrifft somit in einem 
weiteren Aspekt B345-Peptide, abgeleitet von Bereichen 
eines tumorexprimierten B345, die tumorspezif ische 
15 Mutationen aufweisen. 

Auf Grund der bevorzugten Expression von B345 in 
Tumorzellen kann angenommen werden, dass dieses Protein 
eine wichtige Funktion fur den Tumor hat, z.B. fur 
Entstehung, Infiltration und Wachstum und somit ein 
20 Target fur die chemotherapeutische Intervention 
darstellt . 

Im Hinblick auf seinen Einsatz als Target in der 
gezielten Chemotherapie wird B345 naher charakterisiert, 
urn die geeignete Strategie fur die Intervention mit 
25 dieser Funktion zu entwickeln. 

Als ersten Schritt bei der sog. "down- stream" 
Funktionsanalyse von B345 flihrt man zweckmaBig in einem 
ersten Schritt eine bioinformatische Analyse durch, die 
den fur die experimentelle Validierung von B345 als 
30 Target richtungweisend ist. 
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Fur diese Analyse stellen die auf Ahnlichkeit und 
modularer Struktur beruhenden Bioinf ormatik-Konzepte 
eine wesentliche Grundlage dar. Etablierte 
bioinf ormatische Kilf smittel zur Feststellung von 
5 Ahnlichkeiten sind BLAST 

( http: / /www. ncbi .nlm.nih.gov/BLAST , Altschul et al . , 
1997) oder FASTA (Pearson & Lipman, 1988), die 
spezialisierten Datenbanken wie Pfam 

( http: //www. Sanger .ac .uk/Pf am , Bateman et al., 2000) und 

10 SMART ( http : //smart . embl- he idelberg . de , Schultz et al . , 
2000), welche Domanenstrukturen beriicksichtigen. Zur 
Verfeinerung der Analyse konnen Applikationen wie 
Clustal ( http: //www2 . ebi.ac.uk/clustalw , Higgins et al . , 
1996) HMMer ( http : //hmmer . wustl . edu ) , PSI-BLAST 

15 (Altschul et al . , 1997) und die PROSITE Datenbank 

( http : / /www . expasy . ch/prosite , Hofmann et al., 1999) 
herangezogen werden. Statist ische Analysemethoden, die 
nicht auf Homblogien beruhen, gestatten die Vorhersage 
weiterer struktur- und funktionsrelevanter Eigenschaf ten 

2 0 wie der SekundMrstruktur und des Auftretens von 

Transmembransegmenten und Helix-Turn-Helix-Mot iven. 
Methoden zur Vorhersage der Sekundarstruktur von 
Proteinen sind verfiigbar; besonders erwShnenswert ist 
Jpred ( http : / /barton. ebi . ac .uk/ servers/ jpred.html , Cuff 

25 et al., 1998) . Die Sekundarstrukturvorhersage kann 

Funktionshypothesen untermauern, etwa wenn die Struktur 
des vermuteten Homologen bekannt ist. 

i 

Gemaft Bioinformatikanalyse weist B345 eine helikale 
Transmembrandomane auf, wobei sowohl der N-terminale als 
30 auch der C-terminale Bereich hydrohpil sind, was darauf 
schlielien lasst, dass dieses Protein ein 
Transmembranprotein darstellt. Der N-terminale, 
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extrazellulare Bereich besitzt einige CUB-Domanen, 
welche zu Disulf idbruckenbildung neigen und daher bei 
der Dimerisierung bzw. bei Protein -Protein 
Wechselwirkungen beteiligt sind (Bork et al., 1993). Das 
5 C-terminale, intrazellulare Ende zeigt Homologien zu 
einer Rezeptorkinase und zu einem C-Kinase Substrat . 

In weiterer Folge wird B345 einer biochemischen und 
biologischen Analyse unterworfen. 

In einem nachsten Schritt wird die Funktion von B345 fur 

10 das Tumorgeschehen aufgeklart; z.B. durch 

Proliferationsassays in vitro oder in Tiermodellen, die 
das zu untersuchende B345-Gen uberexprimieren 
(konstitutiv oder induzierbar) und als Kontrolle 
entweder in deletierter (inaktiver) Form exprimieren 

15 oder iiber Antisense hinunteregulieren (siehe z.B. 
Grosveld und Kollias, 1992) . 

B345 kann in Screening -Assays verwendet werden, um 
Substanzen zu identif izieren, die die Aktivitat dieses 
Proteins modulieren, insbesondere inhibieren. In einer 

20 Ausfiihrungsform kann ein derartiger Assay z. B. darin 
bestehen, das B345 Protein, oder ein aktives Fragment 
davon, in Zellen, die auf die Aktivitat von B345 mit 
Proliferation reagieren, einzubringen bzw. die' 
entsprechende B345 cDNA in der Zelle zur Expression zu 

25 bringen, und die Proliferation der Zellen in Gegenwart 
und in Abwesenheit einer Testsubstanz zu bestimmen. 

Ein Beispiel fur Testzellen sind Zellen mit niedriger 
Teilungsrate, z.B. primare Zellen, die kein endogenes 
B345 aufweisen. Um die Eignung der Zellen ftir einen 
30 Screening-Assay festzustellen, werden diese mit 
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B345-CDNA transf ormiert , gezuchtet und mit Standard- 
Assays, z.B. Thymidin-Einbau, auf ihre 
Prolif erationsfahigkeit getestet. Aufgrund einer nach 
B345-Expression signif ikanten Erhohung ihrer 
5 Proliferationseigenschaft konnen sie als Testzellen 
eingesetzt werden, z.B. in High Throughput Screening 
Prolif erationsassays. Beispiele fur Prolif erationsassays 
im High Throughput Format, z.B. auf Grundlage des MTS- 
Assays, sind in der WO 98/00713 beschrieben. 

10 Substanzen mit prolif erationshemmender Wirkung konnen 
zur Behandlung von Tumoren mit starker B34 5 -Expression 
verwendet werden, insbesondere beim Lungen-und 
Ko 1 onkar z i nom . 



15 Figurenubersicht : 

Fig. 1A: Expressionsprof il von B345, B452 und B540 in 
individuellen Lungenkarzinomen und 
Lungentumorzelllinien. 

Fig. IB: Expressionsprof il von B345 in normalem 
20 Dickdarmgewebe und Tumorzelllinien. 

Fig. 1C: Graphische Darstellung des Alignments von 
B345, B452 und B540. 

Fig. 2A: Northern Blot Analyse der Tumorzelllinie A549 
mit einem 490bp langem B345 PCR-Produkt 



25 Fig. 2B: 



Northern Blot Analyse verschiedener 
Normalgewebe mit einem 490bp langem B345 
PCR-Produkt 
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Fig. 2C: Northern Blot Analyse verschiedener 

Krebsgewebe mit einem 318bp langen B345 
PCR-Produkt 

Fig. 3 mRNA Expressionsanalyse von B345 durch 
5 real-time PCR von Tumor- und Normal -Geweben. 

Fig. 4: mRNA Expressionsanalyse von B345 durch 

real-time PCR von Laser-Mikroskop-praparierten 
Dickdarmtumoren (LCM) sowie normalem 
Dickdarmgewebe und Tumorzelllinien. 

10 Fig. 5: Graphische Darstellung der Genstruktur von 
B345. 

Fig. 6: Hydrophilizitats-und Transmembran-Blot des 
B345-Proteins 

Fig. 7: Potentielle Proteinstruktur von B345 

15 



Tabellenubersicht 

Tab. 1: Zusammenfassung der Northern Blot Daten von 
B345 in verschiedenen Normalgeweben (1A) , 
20 Krebszelllinien (IB) ; und verschiedenen 

Normalgeweben im Vergleich mit dem 
entsprechenden Tumorgewebe (1C) 

Tab. 2A: Zusammenfassung der Daten der quant itativen 
PCR von B345 in verschiedenen Normal- und 
2 5 Krebsgeweben 
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Tab. 2B: Zusammenfassung der Daten der quantitativen 
PCR von B345 in verschiedenen Normalgeweben 
und mikrodissektierten Kolonadenokarzinom 
Geweben 

5 

Zeichenerklarung 
+++ extrem positiv 

++ stark positiv 

+ positiv 
10 ( + ) schwach positiv 

negativ 

Beispiel 1 

RDA (^Representational Difference Analysis 5 ") von der 
15 humanen Adenokarzinom-Zelllinie der Lunge (A549) und 
normal em Lungengewebe 

Die von ATCC bezogene humane Lungenadenokarzinom- 
Zellinie A549 (CCL 185) wurde in T150 Zellkulturf laschen 
hochgeztichtet . Als Nahrmeclium diente MEM mit 10% hitze- 

20 inaktiviertem, fotalem Kalberserum und 2 mM L-Glutamin. 
Alle 3 bis 4 Tage wurden die Zellen durch Trypsinisieren 
1:5 bis 1:10 zur Propagation gespalten. Nach Erreichen 
von etwa 80% Konfluenz wurden pro T150 Zellkulturf lasche 
4 ml einer Trypsinlosung (Angaben pro Liter: 8g NaCl, 

25 0,2g KC1, l # 13g Na 2 HP0 4 -wasserf rei , 0,2g KH 2 P0 4 , 

100ml 2 f 5% Trypsinlosung, lg EDTA-Na-Salz; pH 1,2 - 7,4) 
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zum Ernten der Zellen eingesetzt. Die 4 ml wurden in ein 
15 ml Falconrohrchen transf eriert , mit 8 ml PBS 
versetzt, bei 1200 rpm in einer Haereus Tischzentrif uge 
(Megafuge 2. OR) 5 min bei 4°C zentrif ugiert , das 
5 Zellpellet mit 1 ml Lysis-Puffer (lOmM Tris-HCl pH8, 
140mM NaCl, 1,5 mM MgCl 2 , 0,5% NP40) versetzt, kraftig 
geschuttelt und in einem 2 ml Eppendorfgef aft bei 
12 000 rpm und 4°C 5 min in einer Sigma Tischzentrifuge 
(Sigma 202 MK) abzentrif ugiert . Der Uberstand wurde in 

10 ein neues Eppendorfgef aft transf eriert und nach Zusatz 
von 55 pi 20% SDS-Losung zweimal mit dem doppelten 
Volumen an einer CHCl 3 /Phenol (1:1 v/v) Mischung und 
einmal mit dem einfachen Volumen an CHC1 3 extrahiert. Die 
wassrige RNA-enthaltende Phase wurde mit 1/10 Volumen an 

15 3M NaAc (pH5) und dem zweifachen Volumen an 96% EtOH 

versetzt und liber Nacht bei -20°C die RNA prazipitiert . 
Ausgehend von 1 mg Gesamt-RNA wurde fur die Isolierung 
von poly-A( + )RNA mittels des PolyATtract Kit (Promega) 
entsprechend dem Hersteller-Protokoll vorgegangen. Die 

20 Lagerung der A549 poly-A(+)RNA mit einer Konzentration 
von 1 mg/ml in DEPC-behandeltem H 2 0 erfolgte in Aliquots 
bei -80°C. 

Zur Durchf iihrung der reprasentativen Dif f erenzanalyse 

(RDA; Hubank and Schatz, 1994; Diatchenko et al . , 1996) 

* 

25 wurde die poly-A( + )RNA der Lungenadenokarzinom-Zellinie 
A549 als „tester" , die von normalem Lungengewebe 
(1 mg/ml; Clontech, Palo Alto; #6524-1) als „driver u 
eingesetzt . Die RDA wurde unter Verwendung des 
PCR-select™ kit (Clontech, Palo Alto) entsprechend dem 

30 Hersteller-Protokoll durchgef uhrt, mit der Ausnahme, 
dass ein rnodif iziertes Primer/Adaptor- 2- 
Oligonukleotidsystem zum Einsatz kam: Adaptor- 2- alt -1 
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(SEQ ID NO: 31) und nested-PCR-primer-2-alt 
(SEQ ID NO: 32) und Adaptor- 2 -alt -2 (SEQ ID NO: 33). Die 
neu generierten Primer/Adaptor-Sequenzen ermoglichen 
durch die Anwesenheit von drei neuen 

5 Restriktionsenzymschnittstellen (Kpn I, Sac I und Xho I) 
in der Sequenz des nested-PCR-primer-2-alt nach 
Klonierung der subtrahierten cDNA- Fragment e in den 
pPCRII-Vektor ein nachtragliches Herausschneiden der 
jeweiligen cDNA- Fragment e. Das Designen einer 

.0 Primer/Adaptorsequenz mit mehreren verfugbaren 

Restriktionsenzymschnittstellen war deshalb notwendig, 
weil besonders in den Primersequenzen - bedingt durch 
die PCR-Amplifikationsschritte- oft Punktmutationen zu 
beobachten waren. 

15 Nach der Synthese von doppelstrangiger cDNA mittels 
oligo-dT wurde die erhaltene cDNA von "tester 11 und 
"driver" mit Rsal verdaut (Rsal ist ein 4-Basen 
erkennendes Restriktionsenzym und liefert im 
statistischen Mittel 256 bp lange cDNA-Fragmente) . 

20 Gleiche Teile von " tester- cDNA" wurden entweder mit den 
Adaptoren 1 Oder 2 ligiert und anschliefiend getrennt mit 
einem Oberschuss an "driver-cDNA" bei 65 °C hybridisiert . 
Danach wurden die beiden Ansatze vereinigt und einer 
zweiten Hybridisierung mit frischer denaturierter 

25 "driver-cDNA" unterworfen. Die angereicherten " tester" - 
; spezifischen cDNAs wurden anschliefiend durch PCR, mit 
fur die Adaptoren 1 bzw. 2 spezifischen Primern, 
exponentiell amplif iziert . Fur eine weitere Anreicherung 
wurde ein Aliquot dieser Reaktion einer zweiten PCR mit 

30 spezifischen nach innen versetzten ("nested") Primern 
unterworfen. Die aus dieser Reaktion result ierenden, 
exponentiell amplif izierten cDNA- Fragment e wurden direkt 
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in den pCRII-Vektor (Invitrogen; "TA-cloning vector" ) 
ligiert und anschliefcend ein Drittel des 
Ligationsansatzes in kompetente E. coli (OneShot™, 
Invitrogen) transf iziert . 

5 712 positive Transf ormanten (Blau-Weifc-Selektion) wurden 
erhalten und in 96-Napf Blocken in LB -Amp Medium (1,3 ml 
pro Napf) fur 48 h bei 37°C kultiviert. Pro Nap f wurden 
750 \il der E. coli Suspensionen fur die Preparation der 
Plasmid-DNA eingesetzt (96-Napf- Minipraparationsmethode 
10 von QIAgen nach Vorschrift des Herstellers) . Die 
verbleibenden Bakterienkulturen wurden als 
Glycerinstammkulturen bei -80°C gelagert. 

Es wurde eine aus 712 Einzelklonen bestehende cDNA- 
Subtraktionsbibliothek erhalten, die sowohl in Form von 
15 E. coli Glycerin- Stammkulturen als auch in Form 
gereinigter Plasmide vorlag. 

Beispiel 2 

DNA-Sequenzierung und Annotation von TAA-Kandidaten 

20 Die isolierte Plasmid-DNA sSmtlicher 712 Klone (siehe 
Beispiel 1) wurde nach der Sanger-Methode auf einem 
ABI-377 Prism Gerat sequenziert. Die erhaltenen 
Sequenzen wurden mittels der BioScout-Sof tware (LION, 
Heidelberg) annotiert und Datenbankvergleichen (Genbank) 

2 5 unterzogen. Von 712 Klonen konnten 678 sequenziert und 

annotiert werden. Der Rest (34) wies als Insert entweder 
nur poly (A) Sequenzen auf oder entsprach einem 
religierten Vektor oder war nicht sequenzierbar . Von den 
678 annotierbaren Sequenzen erwiesen sich 357 als Gene 
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mit bekannter Punktion. Die rest lichen 
321 reprasentierten Klone, kodierend fur Gene mit 
unbekannter Funktion; 59 davon wiesen nicht einmal 
EintrMge in der humanen EST-Datenbank auf. Bekannte Gene 

5 wurden nicht weiter behandelt. Fur jene unbekannten 

Gene, ftir die ein EST-Eintrag verfiigbar war, wurde eine 
Abschatzung des Expressionsprof ils vorgenommen: dabei 
wurden all jene ESTs mit > 95% Identitat (BLAST) , die 
zur entsprechend experimentell ermittelten Sequenz der 

0 Subtraktionsbibliotheken gehorten, uberpriift, Bei der 
Annotation wurde eine Unterteilung in a) kritische 
Normalgewebe, b) fotale, "verzichtbare" und 
immunprivilegierte Gewebe und c) Tumore und Tumor - 
Zellinien vorgenommen. Auf der Basis dieses "virtuellen 

5 mRNA-Prof ils" ( "virtueller Northern blot") wurden 

200 Klone, fur die keine ESTs in der Gruppe a) gefunden 
wurden, ftir weitere experimentelle Analysen ausgewahlt 
(inklusive der 59 Klone, flir die keine EST-Eintragung 
vorlag) . Zur weiteren Einengung der Kandidatenklone 

0 wurden aus den von den 200 ausgew£hlten Klonen 
ermittelten Sequenzen Oligonukleotidprimerpaare 
entworfen und synthetisiert . Es wurden zunachst 
8 verschiedene, von humanem Gewebe abgeleitete 
cDNA-Bibliotheken (GibcoBRL "SUPERSCRIPT™") , welche 

5 direktional in pCMV-SPORT kloniert sind, mittels 

qualitativer PGR auf das Vorhandehsein der jeweiligen 
Kandidaten getestet. Die dabei eingesetzten 
cDNA-Bibliotheken stammten aiis Gewebe von Herz 
(#10419-018), Leber (#10422-012), Leukozyten 

0 (#10421-022), Niere (#10420-016), Lunge (#10424-018), 
Testis (#10426-013), Gehirn (#10418-010) und fotalem 
Gehirn (#10662-013) • Die PCR-Bedingungen waren wie 
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folgt: 20 jal Gesamtvolumen pro PCR-Ansatz enthielten 
1 x TaqPol-Puf fer (50mM KCl, 10 mM Tris-HCl pH9, 
0,1% Triton X-100) , 1,5 mM MgCl 2 , 0,2 mM dNTPs (Promega) , 
0,025 U/pl Taq-DNA-Polymerase (Promega), jeweils 5 pM an 
5 spezifischen Oligonukleotidprimer fUr B345 (B345-D, 

SEQ ID NO: 34) und (B345-U, SEQ ID NO: 35) sowie 100 ng 
der .jeweils zu untersuchenden Plasmid-DNA. Zur Kontrolle 
wurden spezifische Primer fur GAPDH (SEQ ID NO: 36 
und 37) eingesetzt. Zur Oberprufung des selektiven 

10 Nachweises wurden die jeweiligen B345 spezifischen 

Primerpaare Oligonukleotidprimer (SEQ ID NO: 34) und (SEQ 
ID NO: 35) parallel auch auf das isolierte Plasmid mit 
dem B345 "original Fragment" hin ausgetestet 
(ursprunglich isoliertes cDNA- Fragment von B345) . Die 

15 Nachweisbarkeit von . Fragmenten der zu erwartenden Lange 
mit starkem Signal in einem der kritischen Normalgewebe 
(Herz, Leber, Lunge, Niere und Leukozyten) , nicht jedoch 
in den cDNA-Bibliotheken aus immunprivilegierten Geweben 
(Gehirn, fotales Gehirn und Testis) unter diesen 

20 PCR-Bedingungen (1 Zyklus: 3' 94°C; 35 Zyklen: V 94°C - 
1' 55°C - 1' 72°C; 1 Zyklus: 7' 72°C) wurde als 
Ausscheidungskriterium definiert. Mittels dieser 
qualitativen PCR- Analyse konnte die Zahl der Kandidaten 
auf 56 eingeengt werden; Klon B345 befand sich in dieser 

25 bereits vorselektionierten Kandid^atengruppe • 
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Beispiel 3 

Expressionsanalyse durch cDNA Chip Hybridisierung 

Fur das Design eines cDNA Chips wurden von der dBEST 
Datenbank uber Nukleotid-Sequenzsuche eine Reihe von 
5 Klonen ausgew£hlt, die zu verschiedensten 

Funktionskategorien, wie Apoptose bis zur Zellzyklus- 
Regulation, gehbren. Ingesamt wurden 1299 IMAGE Klone 
(davon reprasentieren 1024 bereits bekannte Gene) 
bestellt und zur Kontrolle sequenziert. 

10 Mikrotiterplatten mit Bakterien, die ca. 800 bp lange 
Sequenzen vom 3"Ende des Gens im Vektor enthalten, 
wurden an Incyte Pharmaceuticals, Inc. (USA) geschickt 
und diese dort auf 60 Chips gespottet. Neben diesen 
Klonen wurden auch 120 durch RDA i dent if izierten EST 

15 Klone auf die Chips gespottet. Die so produzierten DNA 
Chips wurden anschlieiiehd mit Cy3 markierter cDNA aus 
Normalgewebe, Tumorgewebe und Zelllinien zusammen mit 
Cy5 markierter cDNA aus einer Mischung von neun 
verschiedenen Normalgeweben hybridisiert und die beiden 

20 Signale zur Normal is ierung der Express ionswerte 

verglichen. Die Berechnungen erfolgten teilweise in 
S-Plus oder in Microsoft Excel. Die Auswertung der Chip 
Experimente ergab ein sehr ahnliches Expressionsprof il 
fur B345, B540 und B452 bei der Hybridisierung mit 

25 . Lungenkrebs Proben von Zelllinien und Patientenmaterial 
(Siehe Fig. 1A) . Solch ein tumorassoziiertes 
Expressionsprof il konnte fur B345 auch bei Vergleich von 
Kolon Adenokarcinom mit Kolon Normalgewebe gezeigt 
werden (Siehe Fig. IB) . 
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Das Sequenzalignment von B345, B540 und B452 zeigte 
eindeutig ein Oberlappen der einzelnen EST Fragmente. 
Daher konnte man annehmen, dass es sich bei den drei 
Klonen urn ESTs von ein und dem selben Gen handelt. Der 
5 daraus resultierende DNA Abschnitt deckt eine Lange von 
843 bp ab (Siehe Fig. 1C) und wurde in weiteren 
Versuchen zur Durchsuchung von of f entlichen Datenbanken 
verwendet. Die Suchergebnisse lieferten keine 
signifikante Homologie zu bekannten DNA bzw. Protein 
10 Sequenzen, was darauf hindeutet, dass es sich bei B345 
um ein bis lang unbekanntes Gen handelt. 

Beispiel 4 

Expressionsanalyse von B345 mittels Northern Blots 

15 Bei B345 handelt es sich um ein Gen, das laut DNA Chip 
Analysen in Tumorgeweben (siehe Fig. 1A und IB, Tab. la 
und Tab. IB) hochreguliert ist. 

Um einerseits das erhaltene Transkriptionsprof il zu 
bestatigen und andererseits die Lange der zu erwartenden 

20 mRNA fur die full size Klonierung zu bestimmen, wurde 
fur B345 eine Northern Blot Analyse unter Einsatz von 
humanen Zelllinien und des "Human Multiple Tissue 
Northern Blots" (Clontech und Invitrogen) durchgefuhrt . 
Als Sonden dienten die mit [ct- 32 P]dCTP (NEN, Boston) 

25 markierten 490 bp bzw. 318bp langen PCR Produkte von 
B345 (Primer (SEQ ID N0:5 und SEQ ID N0:6 bzw. SEQ ID 
NO:7 und SEQ ID NO:8)). Die Hybridisierung erfolgte bei 
68° fur 2 h; die Visualisierung durch Standard- 
Autoradiograf ie (Hyperfilm, Amersham) . Fig. 2A, 2B und 
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2C sowie Tab. la und Tab. IB, 1C zeigen das Ergebnis 
dieser Analyse: Fig. 2A von der Zelllinie A549, Fig. 2B 
von 12 Normalgeweben (Periphere Blut Lymphozyten (PBL) , 
Lunge, Placenta, Dunndarm, Leber, Niere, Milz, Thymus, 
5 Kolon, Skelettmuskel, Herz und Him) und Fig. 2C von 
8 Krebszelllinien (Promyelozytische Leukamie HL60, 
HeLa-S3, chronische myelogene Leukamie K-562, 
lymphoblastische Leukamie MOLT-4, Burkitt^s Lymphom 
(Raji), Kolon Adenokarzinom SW480, Lungen Adenokarzinom 
10 A549 und Melanom G361) . Das B345-Transkript zeigt eine 
Lange von 6,5 kb. 

Beispiel 5 

Analyse des Expressionsprof ils von B345 auf RNA-Ebene 
15 mittels quantitativer RT-PCR (real time PCR oder 
TaqMan- Analyse ) 

Urn eine exaktere Quant if izierung der mRNA Expression in 
den verschiedenen normal und Tumorgeweben durchzufuhren, 
wurde die "real time PCR" angewandt, die es erlaubt die 
20 RNA Konzentration im Vergleich zu einen externen 
Standard zu berechnen. 

Die Isolierung der RNA aus Gef riergewebe erfolgte mit 
Trizol gemafi dem Herstellerprotokoll von Gibco. Zur 
Entfernung von etwaig kontaminierender DNA wurde die 
25 praparierte RNA wie folgt mit DNAase I verdaut: 3 pg 
Gesamt-RNA wurden mit 20 yl 5x AMV Puffer (Promega) , 
1 pi RNasin (Promega) und 2 \xl DNase I (Boehringer 
Mannheim) in einem Gesamtvolumen von 80 pi 15 Minuten 
bei 37 °C inkubiert. 120 ]il Phenol : Chloroform : 
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Isoamylalkohol (25:24:1) wurden zugegeben, auf einem 
Vortexer gemischt und kurz abzentrif ugiert . Die wassrige 
Phase wurde abgenommen, mit 120 pi Chloroform: 
Isoamylalkohol (24:1) versetzt und wie vorher 
5 zentrif ugiert . Die gereinigte RNA wurde Ethanol-gef allt 
und in Wasser gelbst. 

Anschliefcend wurde die Gesamt-RNA mit reverser 
Transkriptase «( Superscript , Gibco, BRL) in cDNA 
umgeschrieben: Zu 3 pg Gesamt-RNA wurden 1 pi Oligo dT 

10 primer (Promega) zugegeben und mit Wasser auf ein 

Endvolumen von 10 pi gebracht. Nach einer Inkubation von 
5 Minuten bei 70 °C wurde die L5sung 5 Minuten bei 
Zimmertemperatur abgekuhlt. 5 pi RT reaction buffer (5x, 
Gibco, BRL), 2,5 pi dNTPs (je 10 mM, Boehringer 

15 Mannheim), 1 pi RNasin (lOU/pl, Promega), 1,5 pi 

Superscript (10 U/pl, Gibco, BRL) und 5 pi Wasser wurden 
zugegeben und 1 Stunde bei 42 °C inkubiert und die 
Reaktion durch Inkubation von 3 Minuten bei 95 °C ) 
beendet . 

20 Zur Herstellung eines cDNA-pools eines bestimmten Gewebe 
oder Tumortyps wurden 3 bis 10 verschiedene 
Einzelpraparationen von unterschiedlichen Patienten in 
gleicKen Anteilen gemischt. 

Die quantitative Bestimmung der "Haushaltsgene" ft-Aktin, 
25 GAPDH und Tubulin in cDNA-pools wurde wie folgt 
durchgefuhrt: 

A) 13-Actin-TaqMan PCR (Perkin Elmer) 



Details liber das Prinzip der TaqMan Methode siehe 
Herstellerinformation (Perkin Elmer) . Ein TaqMan PCR 
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Lauf beinhaltete Proben an fi-Actin-Kontrollsequenz mit 
je 10 2 , 10 3 , 10 4 , 10 s unci 10 s Kopien/pl (Perkin Elmer) zur 
Bestimmung der Standardkurve, eine Negativkontrolle ohne 
DNA una die zu quantif izierenden cDNA-pools. Aiie Proben 
5 wurden in Triplikaten analysiert. Fur einen 25 pi 

Reaktionsansatz wurden 1 pi cDNA, 2,5 pi lOx Puffer A 
(Perkin Elmer), 4 pi MgCl2 (25 mM, (Perkin Elmer)), 
0,5 pi je Nukleotid (10 mM dATP, dCTP, dGTP; 20 mM 
dUTP), 0,125 pi TaqMan Sonde (20 pM; TaqMan Sonde fur 
10 fi-Aktin (SEQ ID NO: 20f luoreszenzmarkiert am 5'-Ende mit 
6-Carboxyf luorescein und mit 

6-Carboxytetramethylrhodamine am 3'-Ende), 1 pi je 
il-Aktin spezifischer Primer (je 20 pM, Forward Primer 
SEQ ID NO:21 und Reverse Primer SEQ ID NO:22), 0,25 pi 

15 AmpErase uracil N-Glycosylase "UNG" (1 U/pl, Perkin 
Elmer), und 0,125 pi AmpliTaq Gold (5 U/pl, Perkin 
Elmer) gemischt, in MicroAmp .Optical Tubes (Perkin 
Elmer) uberfiihrt und mit MicroAmp Optical Caps 
verschlossen. Die PCR wurde f olgendermaften durchgefuhrt : 

2 0 ein Zyklus mit 2 Minuten 50 °C fur die UNG Reaktion, ein 
Zyklus 10 Minuten 95°C zur Aktivierung der AmpliTaq, 
40 Zyklen mit je 15 Sekunden 95° und 1 Minute 60 °C. 
Anschliefiend wurden die Proben auf 25 °C gehalten. Die 
Auswertung der Daten erfolgt mit dem Programm "Sequence 

25 Detection System 1.5bl" -(PE Applied Biosystems) , wobei 
im Prinzip die Fluores^enzsignale der zu 
quantif izierenden cDNA-Proben mit den Signalen der 
Kontrollplasmidverdiinnungen bekannter Konzentration 
verglichen wurden. 

30 B) GAPDH-TaqMan PCR 
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Fur die Quantif izierung von GAPDH, das wie JJ-Aktin oder 
Tubulin zur Normalisierung der eingesetzten RNAs 
verwendet wurde, sind folgende Primer bzw. Sonden 
eingesetzt worden. Als TaqMan Sonde fur GAPDH diente 
5 (SEQ ID NO: 23) eine am 5'-Ende mit 

Tetrachlorf luorescein und am 3'-Ende mit 
Carboxymethylrhodamin markierte Sonde (Forward GAPDH 
Primer: SEQ ID NO: 24 und Reverse Primer: SEQ ID NO: 25) . 
Die Reaktionen wurden wie oben beschrieben durchgefuhrt. 

10 C) Tubulin- SybrGreen PGR (Perkin Elmer) 

Prinzip der SybrGreen PCR siehe Herstellerinf ormation 
(Perkin Elmer) . Ein SybrGreen PCR Lauf beinhaltete 
Proben an Tubulin-Kontrollplasmid mit je 10 2 , 10 3 , 10 4 , 
10 s und 10 6 Kopien/pl (Perkin. Elmer) zur Bestimmung der 

15 Standardkurve, eine Negativkontrolle ohne DNA und die zu 
quantif izierenden cDNA-pools. Alle Proben wurden in 
Triplikaten analysiert. Fiir einen 25 pi Reaktionsansatz 
wurden 1 pi cDNA, 2,5 pi lOx SybrGreen Puffer (Perkin 
Elmer), 3,5 pi MgCl2 (25 mM, Perkin Elmer) ), 0,5 pi je 

20 Primer (je 20 pM, Perkin Elmer, Tubulin Forward (SEQ ID 
NO:26); Tubulin reverse (SEQ ID NO: 27) , 0,25 pi AmpErase 
uracil N-Glycosylase "UNG" (1 U/pl, Perkin Elmer), und 
0,25 pi AmpliTaq Gold (5 U/pl, Perkin Elmer) gemischt, 
in MicroAmp Optical Tubes (Perkin Elmer) iiberfuhrt und 

25 mit MicroAmp Optical Caps "verschlossen. Die PCR wurde 
folgendermaften durchgefuhrt: ein Zyklus mit 2 Minuten 
50°C fur die UNG Reaktion, ein Zyklus 10 Minuten 95°C 
zur Aktivierung der AmpliTaq, 40 Zyklen mit je 15 
Sekunden 95° und 1 Minute 60°C. Anschliefcend wurden die 

30 Proben auf 25 °C gehalten. Die Auswertung der Daten 
erfolgt mit dem Programm "Sequence Detection System 



WO 02/04508 



34 



PCT/EP01/07705 



1.5bl" (PE Applied Biosystems) , wobei im Prinzip die 
Fluoreszenzsignale der zu quant if izierenden cDNA-Proben 
mit den Signalen der Kontrollplasmidverdunnungen 
bekannter Konzentration vergiichen wurden. 

5 D) B345-TaqMan PCR 

Die quantitative TaqMan-PCR-Analyse von B345 wurde, wie 
fur die "Haushaltsgene" beschrieben, durchgefuhrt . Es 
wurden jedoch B345 spezifische Primer (SEQ ID NO: 28 und 
SEQ ID NO: 29) (200 ng/jil) und eine B345 spezifische 

10 Sonde (SEQ ID NO:30, 20 jiM) , die am. S'-Ende mit 
Tetrachlorfluorescein und am 3'-Ende mit 
Carboxymethylrhodamin markiert ist, verwendet. Als 
Standard wurde das PCR Produkt von B345 mit den Primern 
SEQ ID NO: 28 und SEQ ID NO: 29 mit bekannter Kopienzahl 

15 eingesetzt. 

Fig. 3 veranschaulicht die TaqMan- Expressionsanalyse 
(Fig. 3A: fi-Actin; Fig. 3B: Tubulin) . Es zeigte sich, 
dass B345 h5her in Dickdarmkrebsgewebe als in 
Normalgewebe exprimiert ist (siehe Tab. 2a) . Nun stellt 

20 aber sowohl das Normalgewebe als auch das Tumorgewebe 

ein sehr heterogenes Gemisch von verschiedenen Zelltypen 
dar. Weiteres variiert der Anteil von Tumor zellen im 
Tumorgewebe sehr stark von etwa 30 bis 80%. Urn diese 
biologische Heterogenitat auf ein Minimum zu 

25 beschranken, wurden die Epithelzellen des Dickdarms, die 
die Ursprungszellen des Adenokarzinoms darstellen, und 
die Krebszellen oder Krebsareale durch Laser- 
Mikrodissektion spezifisch prapariert. Gewebeschnitte 
von 10pm Starke wurden mit dem Kyromikrotom von Leica, 

30 Jung CM1800 angefertigt und auf einen mit Polyethylen 
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beschichteten Objekttrager aufgebracht (Bohm et al., 
1997) . Die bei Raumtemperatur fur etwa 30 Minuten 
getrockneten Schnitte wurden mit Mayers Hematoxylin 
(SIGMA DIAGNOSTICS) inkubiert und anschliefiend zur 
5 Entfernung von unspezifisch gebundenen Farbstoff fiinf 
Minuten unter fliefiendem Wasser gewaschen. Nach ftinf 
miniitigem Trocknen bei 37 °C wurde die Laser- 
Mikrodissektion durchgef vihrt . Dafur wurde das 
Lasermikroskop von PALM (PALM GmbH, Bernried, 

10 Deutschland) eingesetzt und etwa 2000 bis 5000 Zellen 
prapariert. Die durch Reverse Transkription gewonnene 
cDNA, wurde auch hier durch Real Time PCR analysiert. 
Das Ergebnis zeigt, dass die B345 Expression in 
Dickdarmkarzinom Zelllinien sowie in Patientenmaterial 

15 urn ein Vielfaches hoher ist als vergleichsweise die des 
Dickdarmnormalgewebes . Zur Normal is ierung wurde der 
Expressionslevel von GAPDH bestimmt (siehe Fig. 4 und 
Tab. 2B) . 



WO 02/04508 



PCT/EP01/07705 



36 

Beispiel 6 

a) Klonierung der cDNA von B345 

Das Durchsuchen von Datenbanken nach Sequenzen von 
Genfragmenten (ESTs, expressed sequence tags), die fiir 
5 die „in silico" Klonierung von B345 herangezogen werden 
konnen, ergab ein uberlappendes EST-Kontig von etwa 
1500 bp. Der polyA-Bereich an einem. der Enden gab 
Hinweis auf die Orientierung des DNA Abschnittes in 
Bezug auf 5 y - 3* Orientierung, was beim Design von 
10 neuen Primern fur die Amplif ikation von B345- 
spezifischen cDNA- Fragment en essentiell ist. 

Zunachst wurde das durch die Datenbankanalyse 
beschriebene potentielle 3* Ende durch experimentelle 
Ansatze verifiziert. RNA von der Lungen-Karzinom 
15 Zelllinie Calu 6 (AACC No. HTB56) wurde mit Hilfe des 
Primers (SEQ ID NO: 9) revers transkribiert und die 
resultierende einzelstrangige cDNA wurde mittels PCR mit 
den Gen spezifischen Primer SEQ ID NO: 5 und den 
Adapterprimer SEQ ID NO: 10 amplif iziert . 

20 Fiir einen 25 ]il PCR Ansatz wurden 1 ]il des cDNA-pools 

mit 2,5 \il lOxTaq Puffer (Prqmega), 1,5 ]il MgCl 2 (25 mM, 
Promega), 0,5 pi dNTPs (je 10 mM, Boehringer Mannheim), 
1 pi Primermischung (je 20 ]M) , 0,15 \xl Taq Polymerase 
(Promega) in Wasser gemischt. Die PCR wurde wie folgt 

25 durchgefuhrt: lx 94°C 3 Minuten; 30x 94°C 30 Sekunden, 

55°C 30 Sekunden, 72°C 1 Minute; auf 4°C halten. Die PCR 
wurde auf einem 1,2% Agarosegel analysiert. 

Die beiden Primer wurden anschliefJend zum Sequenzieren 
des gereinigten PCR Produktes verwendet. Die ermittelten 
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Sequenzen zeigten eine hohe Homologie mit dem "in 
silico" klonierten DNA Abschnitt (inklusive des PolyA- 
Trakts) . 

Da das Klonieren von 5 ' -Endsequenzen einen meist sehr 
5 aufwendigen Prozess darstellt, wurden im Folgenden zur 
Losung des Problems verschiedene Methoden angewandt. 

Als Ausgangszelllinie wurde auch hier Calu 6 verwendet. 
Nach der reversen Transkription der RNA mit dem Primer 
SEQ ID NO: 9 und der Zweitstrangsynthese wurde an die 

0 Doppelstrang-cDNA ein Linker bestehend aus den beiden 
Oligos SEQ ID NO: 11 und SEQ ID NO: 12 ligiert (Abe et 
al., 1992) - Die daraus result ierende LoneLinker cDNA 
Bibliothek wurde dann mit dem Gen spezifischen Primer 
SEQ ID NO: 6 linear uber 35 Zyklen amplif iziert . Ein 

5 Aliquot der B345 angereicherten cDNA konnte anschlieftend 
mit den Primern SEQ ID NO: 13 und LLEcoRIA SEQ ID NO: 11 
weiter amplif iziert werden. Nach der Gelelektrophorese 
eines Aliquots und Southernanalyse mit dem 
genspezif ischen Oligo SEQ ID NO: 14 konnte eine 5 kb 

0 Bande lokalisiert werden. In weiterer Folge wurde dieses 
Fragment schrittweise sequenziert und auf die Sequenz 
des EST-Kontigs ausgerichtet ("aligned"). 

Urn die result ierende Sequenz aus der LLcDNA Klonierung 
zu liberprufen, wurden zwei Fragmente mittels PCR (SEQ ID 

5 NO:15 und SEQ ID N0:16 bzw. SEQ ID NO:6 und SEQ ID 

NO: 17) amplif iziert und fur das Screenen von Lambda gtlO 
cDNA Phagen Bibliotheken eingesetzt. Positive Plaques 
wurden isoliert und mittels den gtlO spezifischen 
Primern (SEQ ID NO: 18 und SEQ ID NO: 19) PCR 

0 amplif iziert . Anschliefiende Sequenzierung und das 
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Alignment mit den Sequenzen fuhrte zu der Annahme, das 
es sich hierbei urn ein dif f erenzielles SpleiiJprodukt 
handelt. Die SpleiJidonor, Akzeptor und Lariatsequenz 
konnten in weiterer Folge gefunden werden. Mittels PCR 
5 durch geeigneter Primerkombination wurde in 
verschiedenen Zelllinien nach dif f erenziellen 
Spleiftprodukten gesucht, wobei in alien gescreenten 
Zelllinien nur ein Produkt gefunden wurde und zu der in 
Fig. 5 dargestellten Genstruktur fuhrte. Die angefuhrte 

10 cDNA besitzt einen offenen Leserahmen (ORF) der fur ein 
potentielles Protein mit einer Lange von 749 Aminosauren 
kodiert. Die Translationsinitiationsstelle an 
Position 215 entspricht zu etwa 75% einer Kozak- 
Konsensussequenz . Die in diesem Experiment erhaltenen 

15 Ergebnisse veranlassten dazu, in einem weiteren 
Experiment (Beispiel 6b) die 

Transkriptionsinitiationsstelle noch exakt durch Primer- 
Extension zu bestimmen, urn sicher zu gehen, dass das 
hier ermittelte 5 1 Ende das tatsachliche 5'-Ende von 
20 B345 ist. Die von der in diesem Klonierungsversuch 
erhaltenen cDNA (SEQ ID NO:l) abgeleitete 
Aminosauresequenz von B345 ist in SEQ ID NO: 2 gezeigt. 

b) Zweiter Klonierungsversuch; Bestimmung der 5*-und 
der Promotorregion von B345 

25 Mit Hilfe des Promotor Finder DNA Walking Kit (Clontech) 
und anschlieftender Primerextension Reaktion wurden die 
5 * -Region und die Promotorregion sowie die exakte 
Transkriptionsinitiationsstelle bestimmt. Die 5 "-Region 
wurde mit Hilfe einer genomischen DNA Library von 

30 Clontech mit B345 spezifischen Primern (SEQ ID NO: 38 
bzw. nested SEQ ID NO: 39) und Adaptor Primer im Kit 
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amplif iziert . Um den exakten Transkriptionsstart zu 
bestimmen, wurde die Primer Extension Reaktion 
durchgef iihrt . Dafiir wurde der Primer SEQ ID NO: 40 am 
5"-Ende mit Hilfe 10 U der T4 Polynukleotid Kinase 
5 (Promega) und 3pl [y- 32 P]ATP .(3 000Ci/mmol) nach Standard- 
Protokollen markiert (Sambrook et al . , 1989). Das 
markierte Oligonukleotid wurde durch PrSzipitation 
gereinigt. Fur die Primerextension Reaktion wurden 
10.000 cpm Oligonukleotid in einem Gesamtvolumen von 
10 20 pi zu 25 pg Total RNA der Colo 205 Zelllinie 
(ATCC : CCL-222 ) eingesetzt . 

Die RNA der Zelllinie wurde mit dem radioaktiv 
markiertem Primer revers transkribiert und auf ein 
10%- Polyacryamidgel aufgetragen. Zur Bestimmung der 

15 genauen Bandenlange wurde ein PCR Fragment von 
nt 1000 - nt 1362 mit 35 S markierten Nukleotiden 
sequenziert und -ebenfalls aufgetragen. Das aus der 
Elongation des reversen Primers resultierende Fragment 
von 209 Nukleotiden legt den Transkriptionsstart genau 

20 an Position 201 fest. Somit wurde die in Beispiel 6a 

erhaltene B345-Sequenz in der 5 "Region erweitert und ein 
neues Startkodon auf Position 283 bestimmt. Durch 
wiederholte Sequenzierungen auch in der 3 "Region wurde, 
im Vergleich zur in SEQ ID NO:l dargestellten Sequenz, 

25 eine zusStzliche Base an Position 2430 gefunden, die zu 
einer Leserasterverschiebung fuhrt und somit das 
Stoppcodon von Position 2729 auf 2791 verschiebt. Die in 
diesem Versuch erhaltene cDNA (SEQ ID NO: 3) besitzt 
einen offenen Leserahmen, der fur ein potentielles 

30 Protein mit einer LSnge von 836 Aminosauren (SEQ ID 
NO: 4) kodiert. 
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Beispiel 7 

Bioinformatik-Analyse zur Funktion von B345 

Die resultierende primare Aminosauresequenz von B345 ist 
5 in SEQ ID NO: 4 gezeigt. Die Analyse des Hydrophilizitats 
Plots der Aminosauresequenz mit der Methode von Kyte und 
Doolittle (1982) zeigt, dass das B345 Protein zwei 
charakteristische hydrophobe Domanen aufweist 
(Aminosauren Pos. 1-29 und 666 - 691) , die ein 

10 Signalpeptid und eine helikale Transmembrandomane 

darstellen (Fig. 6) . Diese polarisierte Struktur deutet 
darauf hin, dass es sich bei B345 urn ein integrales 
Membraneprotein handelt . Die Transmembranhelix verbindet 
einen etwa 666 Aminosauren langen extrazellularen und 

15 einen kurzen (145 Aminosauren) intrazellularen Teil 
(siehe Fig. 7) . 

Die extrazellulare Domane weist aufterdem klare Indizien 
fur die Existenz einer CUB Domane bei Position 220 - 350 
sowie Indizien fttr 2 mogliche weitere CUB Domanen im 

20 Bereich der Aminosauren 425 - 660 auf . CUB Domanen 
kommen bei verschiedenen, meist wahrend der 
Embryonalentwicklung regulierten Proteinen vor. AuBerdem 
sind manchmal bei EGF (Epidermal Growth 
. Factor) -ahnlichen Dom&nen auch CUB Domanen anzutreffen. 

25 Eine kurzlich erschienene Publikation (Gerstein et al., 
2000) demonstriert, dafi CUB Domanen enthaltende Proteine 
die am ausgepragtesten dif ferenziell regulierten 
Proteine in C. elegans sind. Da Gene, die eine 
Schliisselrolle in der Embryonalentwicklung haben, auch 

30 analoge Funktionen in Krebs ausflihren, kann angenommen 
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werden, dass eine Uberexpression von B345 in Zellen eine 
Veranderung in den Eigenschaften der Substratadhasion 
oder der extrazeliularen Matrix bewirkt. Das Protein 
weist aufterdem 12 potentielle N- Glycosylierungsstellen 
5 auf, die in der vorhergesagten extrazeliularen Domane zu 
finden sind, was mit der vorhergesagten Orientierung des 
Proteins ubereinstimmt . 

Mit einem BLAST hit (E-value: 5.8 x 10" 2 ) fur den Bereich 
der Aminosauren von 235 bis 282 von B345 konnte eine 
10 Komplement aktivierende Komponente des £A-:reactive 

factor (RARF) aus mus musculus identif iziert werden. Das 
Alignment befindet sich innerhalb der CUB Domane 1 von 
B345. 

Die CUB-Domanen 2 and 3 (Bereich 425-535 und 545-660) 
15 weisen marginale Homologien zu dem humanen und Fugu 

Prokollagen C-Proteinase Enhancer Protein (PCOLCE) auf . 
Diese Regionen kommen in dem Bereich von PCOLCE vor, 
welcher ein CUB Domanen Tandem Repeat enthalt (E-values: 
0.5 (human) und 2.7 (Fugu)). CUB Domanen kommen manchmal 
20 in Repeats vor. 

Vermutlich bildet das B345-Protein eine B-Sheet 
Sekundarstruktur, da sich CUB Domanen bekanntlich als 
li- Sandwich falten. 

Die intrazellulare Domane (Bereich 691-836) weist keine 
25 signif ikanten Homologien auf. Der gesamte C-Terminus 
aligned jedoch mit einem EST (AW063026) von humanen 
Eierstockkrebs Zellen (82% Identitat uber 
124 Aminosauren) . 
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Beispiel 8 

Bestimmung der genauen Genstruktur von B345 

Zunachst wurden Bac Klone in of f entlichen Datenbanken 
(BLAST search) gesucht, die das B345-Gen enthalten. Die 
Bac Klone Ac068625 und Ac010170 enthielten einen 
Grofiteil des Gens. Mit intronspannenden Primern wurden 
Spliceakzeptor und Donorsequenzen in Colo 205 cDNA und 
genomischer DNA als Template gesucht. Das PCR Protokoll 
wurde wie folgt durchgefuhrt : lx 95°C 2 Minuten, 
35x 95°C 15 Sekunden, 68°C 3 Minuten und dann auf 4°C 
gehalten. Die PCR wurde auf einem 1,2% Agarosegel 
analysiert und dabei die L^ngen der PCR Produkte der 
2 Templates mit gleichen Primerkombinationen verglichen. 
Es stellte sich heraus, dass B345 aus 8 Exons, getrennt 
von 7 Introns besteht (Fig. 5) . 

Die chromosomal e Lokalisation des Gens wurde mittels 
Fluoreszenz-in situ-Hybridisierung (FISH) bestimmt. 
Dabei wurde die humane, Digoxigenin-markierte B345 Sonde 
zusammen mit der Biotin-markierten Sonde von B47a2 

(Knight et al., 1997), welche sich auf der sub- 
telomerischen Region des Chromosomenarms 3p befindet, 
mit Metaphase-Chromosomen zweier "normaler" Individuen 
hybridisiert (Lichter et al., 1988). Die hybridisierte 
Digqxygenin- Sonde wurde mittels Anti-Schaf -Dig 

(Boehringer Mannheim FRG) und Kaninchen Anti-Schaf FITC- 
markierten Antikdrpern detektiert. Die Biotin markierte 
Probe dagegen wurde mit Maus Anti -Biotin und Kaninchen- 
Anti-Maus (TRITC) und anschliefiende Farbung mit DAPI 
sichtbar gemacht. Die FISH Resultate zeigen, dass eine 
Mehrheit der Metaphasen eindeutige Signale an einem oder 
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beiden Chromatiden des Chromosoms 3 in der Region 
p21-p23 haben. Als Bestatigung der Position diente die 
Co-lokalisation der B47a2 (TRITC) -Sonde auf dem selben 
chromosomal en Arm. 



5 
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Tab.lA 



HiiSS 


m 


PBL 


- 


Lunge 


++ 


Plazenta 


+ 


Dttnndarm 


+ 


Leber 


- 


Niere 


++ 


Milz 




Thymus 




Kolon 


+ 


Skelettmuskel 




Herz 




Hirn 
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Tab . IB 





ilii 


promyelocytische Leukamie HL60 


- 


HELA Zellen S3 


- 


Chronische Myelogene Leukamie K-562 


+ 


Lymphoblastische Leukamie MOLT-4 




Burkitf s Lymphom (Raji) 




Kolon Adenokarzinom SW480 


+++ 


Lungen Adenokarzinom A549 


+ 


Melanom G361 
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Tab.lC 





ills 


Speiserohre Tumor 


(+) 


SpeiserShre Normal 


(+) 


Magen Tumor 




Magen Normal 


+ 


Kolon Tumor 


+++ 


Kolon Normal 


++ 


Mastdarm Tumor 


+ 


Mastdarm Normal 
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Tab . 2 A 









Lunge Adenokarzinom 


+ 


+ 


Lunge Adenokarzinom 


+ 


+ 


Lunge Normal 


- bis (+) 


(+) 


Kolon Adenokarzinom 


++ 


++ 


Kolon Adenokarzinom 


+++ 


+++ 


Kolon Normal 


- bis (+) 


+ 


Mamma IDC 


+ 


+ 


Brust 






Hodgkin's Lymphom 






Milz 






Testis 
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Tab.2B 



Zeli i n felri^' lit jn cl w© B^s^i^i ^ ■ ? ^ ?~ V % ^ 




Kolon Adenokarzinom SW480 


+ 


Kolon Normal (Clonetech) 


( + ) 


Kolon Normal (Invitrogen) 


(+) 


Lungen Adenokarzinom A549 


( + ) 


Kolon Adenokarzinom Colo 205 


+++ 


PG 102142 Tumor (Colon Ac.) 


+++ 


PG 21900 Tumor (Colon Ac.) 


++ 


PG 7066 Tumor (Colon Ac.) 


+++ 


PG 32389 Tumor (Colon Ac.) 


++ 
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Patentanspruche 



1. Tumorassoziiertes Antigen der Bezeichnung B345, 
dadurch gekennzeichnet, dass es die in SEQ ID NO: 4 

5 definierte Aminosauresequenz aufweist oder diese 

als Teilsequenz enthalt, oder ein Fragment davon. 

2. Isoliertes DNA-Molekul, kodierend fur das in 
Anspruch 1 definierte tumorassoziierte Antigen 
oder fur Fragmente davon. 

10 3. DNA-Molekttl nach Anspruch 2, dadurch 

gekennzeichnet, dass es ein Polynukleotid mit der 
in SEQ ID NO: 3 dargestellten Sequenz ist oder 
diese Sequenz enthalt oder dass es ein 
Polynukleotid ist oder dieses enthalt, das mit 

15 einem Polynukleotid der in SEQ ID NO: 3 

dargestellten Sequenz linter stringenten 
Bedingungen hybridisiert , oder ein Fragment davon. 

4. Rekombinantes DNA-Molekul, enthaltend ein 
DNA-Molektil gemafe Anspruch 2 oder 3. 

20 5. Pharmazeutische Zusammensetzung fur die 

Immuntherapie von Krebs, enthaltend als wirksame 
Komponente das in Anspruch 1 definierte 
tumorassoziierte Antigen der Bezeichnung B345 oder 
ein oder mehrere Fragmente davon. 

25 6. Pharmazeutische Zusammensetzung fur die 

Immuntherapie von Krebs, enthaltend als wirksame 
Komponente ein DNA-Molektil gemail einem der 
Anspriiche 2 bis 4 . 
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7. Antikorper gegen das in in Anspruch 1 definierte 
Polypeptid. 

8. Antikorper nach Anspruch 7, dadurch 
gekennzeichnet , dass er monoklonal ist. 

5 9. Antikorper nach Anspruch 7 oder 8 fur die Therapie 
und Diagnose von Krebserkrankungen, die mit der 
Expression von B345 assoziiert sind. 
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Fig. 1B 
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Fig. 1C 
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Fig. 2A 
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Fig. 2B 
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Fig. 2C 
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Fig. 3a 
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Fig. 4 
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Fig.7 
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SEQUENZPROTOKOLL 

<110> Boehringer ingelheim International GmbH 

<120> Tumorexprimiertes Polypeptid B34-5 

<130> case 12_214,219 

<140> 
<141> 

<160> 40 

<170> Patentln Ver. 2.1 



<210> 1 

<211> 5897 

<212> DNA 

<213> Homo sapiens 

<220> 

<221> 5'UTR 
<222> (1) . . (214) 

<220> 

<221> CDS 

<222> (215) . . (2464) 
<220> 

<221> 3'UTR 

<222> (2465) . . (5897) 

<400> 1 

cttgagatat tagaattcgc gactcctgaa ctgcggggtc tctatcgcac tgctaggggt 60 

tctgctgctg ggtgcggcgc gcctgccgcg cggggcagaa gcttttgaga ttgctctgcc 120 

acgagaaagc aacattacag ttc teat aaa gctggggacc ccgactctgc tggcaaaacc 180 

ctgttacatc gtcatttcta aaagacatat aacc atg ttg tec ate aag tct gga 235 

Met Leu Ser lie Lys Ser Gly 
1 5 

gaa aga at a gtc ttt acc ttt age tgc cag agt cct gag aat cac ttt 283 
Glu Arg lie Val Phe Thr Phe Ser Cys Gin Ser Pro Glu Asn His Phe 
10 15 20 

gtc ata gag ate cag aaa aat att gac tgt atg tea ggc cca tgt cct 331 
Val lie Glu lie Gin Lys Asn lie Asp Cys Met Ser Gly Pro Cys Pro 
25 30 35 

ttt ggg gag gtt cag ctt cag ccc teg aca teg ttg ttg cct acc etc 379 
Phe Gly Glu Val Gin Leu Gin Pro Ser Thr Ser Leu Leu Pro Thr Leu 
40 45 50 55 
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aac aga act ttc ate tgg gat gtc aaa get cat aag age ate ggt tta 
Asn Arg Thr Phe He Trp Asp Val Lys Ala His Lys Ser He Gly Leu 
60 65 70 



427 



gag ctg cag ttt tec ate cct cgc ctg agg cag ate ggt ccg ggt gag 475 
Glu Leu Gin Phe Ser He Pro Arg Leu Arg Gin He Gly Pro Gly Glu 
75 80 85 



age tgc cca gac gga gtc act cac tec ate age ggc cga ate gat gee 
Ser Cys Pro Asp Gly Val Thr His Ser He Ser Gly Arg He Asp Ala 
90 95 100 



gaa tac tac ate ccg ggc tec ace acc aac ccc gag gtg ttc aag ctg 
Glu Tyr Tyr He Pro Gly Ser Thr Thr Asn Pro Glu Val Phe Lys Leu 
220 225 230 



523 



acc gtg gtc agg ate gga acc ttc tgc age aat ggc act gtg tec egg 571 
Thr Val Val Arg He Gly Thr Phe Cys Ser Asn Gly Thr Val Ser Arg 
105 110 115 



ate aag atg caa gaa gga gtg aaa atg gee tta cac etc cca tgg ttc 
He Lys Met Gin Glu Gly Val Lys Met Ala Leu His Leu Pro Trp Phe 
120 125 130 135 



619 



cac ccc aga aat gtc tec ggc ttc age att gca aac cgc tea tct ata 667 
His Pro Arg Asn Val Ser Gly Phe Ser He Ala Asn Arg Ser Ser He 
140 145 150 

aaa cgt ctg tgc ate ate gag tct gtg ttt gag ggt gaa ggc tea gca 715 

Lys Arg Leu Cys He He Glu Ser Val Phe Glu Gly Glu Gly Ser Ala 
155 160 165 

•> 

acc ctg atg tct gec aac tac cca gaa ggc ttc cct gag gat gag etc 763 

Thr Leu Met Ser Ala Asn Tyr Pro Glu Gly Phe Pro Glu Asp Glu Leu 
170 175 180 

atg acg tgg cag ttt gtc gtt cct gca cac ctg egg gec age gtc tec 811 
Met Thr Trp Gin Phe Val Val Pro Ala His Leu Arg Ala Ser Val Ser 
185 * 190 195 

ttc etc aac ttc aac etc tec aac tgt gag; agg aag gag gag egg gtt 859 
Phe Leu Asn Phe Asn Leu Ser Asn Cys Glu Arg Lys Glu Glu Arg Val 
200 205 210 215 



907 



gag gac aag cag cct ggg aac atg gcg ggg aac ttc aac etc tct ctg 955 
Glu Asp Lys Gin Pro Gly Asn Met Ala Gly Asn Phe Asn Leu Ser Leu 
235 240 245 

caa ggc tgt gac caa gat gee caa agt cca ggg ate etc egg ctg cag 1003 
Gin Gly Cys Asp Gin Asp Ala Gin Ser Pro Gly He Leu Arg Leu Gin 
250 255 260 

ttc caa gtt ttg gtc caa cat cca caa aat gaa age aat aaa ate tac 1051 
Phe Gin Val Leu Val Gin His Pro Gin Asn Glu Ser Asn Lys He Tyr 
265 270 275 
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gtg gtt gac ttg agt aat gag cga 
Val Val Asp Leu Ser Asn Glu Arg 
280 285 

egg ccc gtc aaa cag age cgc aag 
Arg Pro val Lys Gin Ser Arg Lys 
300 



gee atg tea etc ace ate gag cca 1099 
Ala Met Ser Leu Thr He Glu Pro 
290 295 

ttt gtc cct ggc tgt ttc gtg tgt 1147 
Phe Val Pro Gly Cys Phe Val Cys 
305 310 



eta gaa tct egg ace tgc agt age aac etc ace ctg aca tct ggc tec 1195 
Leu Glu Ser Arg Thr Cys Ser Ser Asn Leu Thr Leu Thr Ser Gly Ser 
315 320 325 

aaa cac aaa ate tec ttc ctt tgt gat gat ctg aca cgt ctg tgg atg 1243 
Lys His Lys He Ser Phe Leu Cys Asp Asp Leu Thr Arg Leu Trp Met 
330 335 340 

aat gtg gaa aaa ace ata age tgc aca gac cac egg tac tgc caa agg 1291 
Asn Val Glu Lys Thr He Ser Cys Thr Asp His Arg Tyr Cys Gin Arg 
345 350 355 

aaa tec tac tea etc cag gtg ccc agt gac ate etc cac ctg cct gtg 1339 
Lys Ser Tyr Ser Leu Gin Val Pro Ser Asp He Leu His Leu Pro Val 
360 ~ 365 370 375 

gag ctg cat gac ttc tec tgg aag ctg ctg gtg ccc aag gac agg etc 13 87 
Glu Leu His Asp Phe Ser Trp Lys Leu Leu Val Pro Lys Asp Arg Leu 
380 385 390 

age ctg gtg ctg gtg cca gee cag aag ctg cag cag cat aca cac gag 1435 
Ser Leu Val Leu Val Pro Ala Gin Lys Leu Gin Gin His Thr His Glu 
395 400 405 

aag ccc tgc aac acc age ttc age tac etc gtg gee agt gee ata ccc 1483 
Lys Pro Cys Asn Thr Ser Phe Ser Tyr Leu Val Ala Ser Ala He Pro 
410 415 420 

age cag gac ctg tac ttc ggc tec ttc tgc ccg gga ggc tct ate aag 1531 
Ser Gin Asp Leu Tyr Phe Gly Ser Phe Cys Pro, Gly Gly Ser He Lys 
425 430 435 

cag ate cag gtg aag cag aac ate teg gtg acc ctt cgc acc ttt gee 1579 
Gin He Gin Val Lys Gin Asn He Ser Val Thr Leu Arg Thr Phe Ala 
440 445 450 455 

ccc age ttc caa caa gag gec tec agg cag ggt ctg acg gtg tec ttt 1627 
Pro Ser Phe Gin Gin Glu Ala Ser Arg Gin Gly Leu Thr Val Ser Phe 
460 465 470 

ata cct tat ttc aaa gag gaa ggc gtt ttc acg gtg acc cct gac aca 1675 
He Pro Tyr Phe Lys Glu Glu Gly Val Phe Thr Val Thr Pro Asp Thr 
475 480 485 

aaa age aag gtc tac ctg agg acc ccc aac tgg gac egg ggc ctg cca 1723 
Lys Ser Lys Val Tyr Leu Arg Thr Pro Asn Trp Asp Arg Gly Leu Pro 
490 495 500 
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tec etc ace tct gtg tec tgg aac ate age gtg ccc aga gac cag gtg 1771 
Ser Leu Thr Ser Val Ser Trp Asn lie Ser Val Pro Arg Asp Gin Val 
505 510 515 

gee tgc ctg act ttc ttt aag gag egg age ggc gtg gtc tgc cag aca 1819 
Ala Cys Leu Thr Phe Phe Lys Glu Arg Ser Gly Val Val Cys Gin Thr 
520 525 530 535 

ggg cgc gca ttc atg ate ate cag gag cag egg acc egg get gag gag 1867 
Gly Arg Ala Phe Met lie lie Gin Glu Gin Arg Thr Arg Ala Glu Glu 
540 545 550 

ate ttc age ctg gac gag gat gtg etc ccc aag cca age ttc cac cat 1915 
He Phe Ser Leu Asp Glu Asp Val Leu Pro Lys Pro Ser Phe His His 
555 560 565 

cac age ttc tgg gtc aac ate tct aac tgc age ccc acg age ggc aag 1963 
His Ser Phe Trp Val Asn He Ser Asn Cys Ser Pro Thr Ser Gly Lys 
570 575 580 

cag eta gac ctg etc ttc teg gtg aca ctt acc cca agg act gtg gac 2011 
Gin Leu Asp Leu Leu Phe Ser Val Thr Leu Thr Pro Arg Thr Val Asp 
585 590 595 

ttg act gtc ate etc ate gca gcg gtg gga ggt gga gtc tta ctg ctg 2059 
Leu Thr Val He Leu He Ala Ala Val Gly Gly Gly Val Leu Leu Leu 
600 605 610 615 

tct gee etc ggg etc ate att tgc tgt gtg aaa aag aag aaa aag aag 2107 
Ser Ala Leu Gly Leu He He Cys Cys Val Lys Lys Lys Lys Lys Lys 
620 625 630 

aca aac aag ggc ccc get gtg ggt ate tac aat ggc aac ate aat act 2155 
Thr Asn Lys Gly Pro Ala Val Gly He Tyr Asn Gly Asn He Asn Thr 
635 640 645 , 

gag atg cca ggc age caa aaa agt ttc aga aag ggc gaa agg aca atg 2203 
Glu Met Pro Gly Ser Gin Lys Ser Phe Arg Lys Gly Glu Arg Thr Met 
650 655 660 

act ccc atg tgt atg cag tea teg agg aca cca tgg tat atg ggc ate 2251 
Thr Pro Met Cys Met Gin Ser Ser Arg Thr Pro Trp Tyr Met Gly He 
665 670 675 

tgc tac agg att cca gcg get cct tec tgc age cag agg tgg aca cct 2299 
Cys Tyr Arg He Pro Ala Ala Pro Ser Cys Ser Gin Arg Trp Thr Pro 
680 685 690 695 

acc ggc cgt tec agg gca cca tgg ggg tct gtc etc cct ccc cac cca 2347 
Thr Gly Arg Ser Arg Ala Pro Trp Gly Ser Val Leu Pro Pro His Pro 
700 705 710 

cca tat get cca ggg ccc caa ctg caa agt tgg cca ctg agg age cac 2395 
Pro Tyr Ala Pro Gly Pro Gin Leu Gin Ser Trp Pro Leu Arg Ser His 
715 720 725 
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etc etc get ccc etc ctg agt ctg aga gtg aac cgt aca cct tct ccc 2443 
Leu Leu Ala Pro Leu Leu Ser Leu Arg Val Asn Arg Thr Pro Ser Pro 
730 735 740 

ate cca aca atg ggg atg taa gcagcaagga cacagacatt cccttactga 24 94 

lie Pro Thr Met Gly Met 

745 750 

acactcagga geccatggag ccagcagaat aacttgatcc attccagacg etttgetgag 2554 

tttcataaag cagggcactg agacacccgt ccgtgttcct aaccagaaat cctaaagaag 2 614 

aggaattata cagaaggaac agcaggaggt tttcctggac accgccaact teacattget 2674 

cagtggactc attctaaggg caagacattg aaaat'gatga attccaatct ggatacagtc 2 734 

atgacagctc atgtgctcct caacttaggc tgtgcggtta gccagcctgt aatgagagga 2794 

gagaggectg agtcacctag catagggttg cagcaagccc tggattcaga gtgttaaaca 2 854 

gaggcttgee ctcttcagga caacagttcc aattccaagg agcctacctg aggtccctac 2 914 

tctcactggg gtccccagga tgaaaacgac aatgtgcctt tttattatta tttatttggt 2 974 

ggtcctgtgt tatttaagag atcaaatgta taaccaccta gctcttttca cctgacttag 3034 

taataactca tactaactgg tttggatgcc tgggttgtga cttctactga cegctagata 3 094 

aacgtgtgcc tgtcccccag gtggtgggaa taatttacaa tctgtccaac cagaaaagaa 3154 

tgtgtgtgtt tgagcagcat tgacacatat ctgetttgat aagagacttc ctgattctct 3214 

aggteggtte gtggttatcc cattgtggaa attcatcttg aatcccattg tcctatagtc 3274 

ctagcaataa gagaaatttc ctcaagtttc catgtgcggt tctcctagct gcagcaatac 3334 

tttgacattt aaagagaaat ttagagaata ttctcatcct ctaaaaatgt ttaaatatat 33 94 

accaaacagt ggccccctgc attagttttc tgttgccact gcaacccatt acttggtagc 3454 

ttaaaaacaa cacattagct tatagtcctg gggatcagaa ttccaaaatg gatgtccctg 3 514 

aatgaaaatc aaggtgtcag cagagctgtg ctccttctga aggctctagg gagaagcegg 3574 

ttccttgcca tttcaagctt ctagaggctg gctgcattcc caggctccag tggctggtca 3634 

agcttttctc acatggcatc actgtgacac tggccctccc acttccctct ttgacttaca 3694 

aagcccacca ggaagatcca ggataatctc tccatctaaa gatccttcat catcctggaa 3754 

gagecttttg ecatgeaaga caacatagcc acaggtgggg attaggacca ggacatcttt 3814 

ggggtgctgt tattctgect accacacctt cctgccacbg actcccacag gagaggctac 3874 

aaaatgatct ggegcacagg gatgttttgt ttagcttgcg gactctaaca cttaaaaaaa 3934 

ccccagatca gaagatctgg ccatgctggg gctcacattc tcacctagca acaactggct 3994 
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ggagctgggc 


accagctctg 


cctttagaag 


gggtgtccac 


ttcaccaggt caccacagcc 


4054 


cacactacgc 


cctatcactt 


cccacaatga 


ggctaagtgt 


ttgtttctac tgatcaatgc 


4114 


ccctgcaggt 


tgcatttatt 


gtaatgaaaa 


agaaagactg 


ggattaatct ctaatcaggt 


4174 


gagtagacca 


tgagaccaat 


gtgtgctcac 


attacccttt 


ttcttttttt tctttttctt 


4234 


tttctttttt 


tttttaatgt 


gagacaggat 


ctcattctgt 


tgcctaggct ggagtgcagt 


4294 


ggcgcaatct 


cggctcactg 


caacctctgc 


ctcctgggct 


caagcaattc tcccacctca 


4354 


gcctcccaaa 


tagctgggat 


cactggcaca 


aaccaccatg 


cccagctaat tttgtatttt 


4414 


ttgtagagac 


agggtttcac 


catgttgccc 


aggctggtct 


caacctcctg ggctcaagca 


4474 


atcctcptgc 


ctcggcctcc 


caaagtgctg 


ggattacaga 


tgtgagccac cgcatccagc 


4534 


cccacaccct 


catttatacc 


aattacctgc 


ccagtaactg 


tggacttttg cttcctcacc 


4594 


cctgctctga 


tctggaagga 


gagggattat 


gttatagctt 


gtcagcacag tcccaagttc 


4654 


aatatttctg 


cggcaaaaac 


ttccttcaaa 


aaataaatgt 


acttcattgt attcaatgaa 


4714 


ttcaccttgg 


aaatgcaccg 


cctcaacttg 


ttcacatggc 


ataaatgaaa ggaattttat 


4774 


agtctcctaa 


atggcgtgta 


ctgcaagacc 


tcttgaacac 


tttccagagg ataggatatt 


4834 


taagtcatgc 


ccttggcgtt 


gcctatggca 


cctttccctt 


ctgaaagtct ggttcctgcc 


4894 


cagtgaccct 


tggccttgtg 


agccgagatg 


ctgaccctgc 


ataaagggcc aaaggagggc 


4954 


tgcggcttcc 


ttccctcact 


gaagagccct 


tatttgaatt 


cactgtgtgg agccctagcc 


5014 


ctccattctc 


gacattcccc 


aacctcccag 


ccccttccaa 


gcaggactag gtgccctgca 


5074 


ttccacccaa 


ggtgggattg 


gccttcctta 


ggctggctac 


ttgtcaccat caccgacatc 


5134 


actgttgcct 


gcaaggacac 


cacgtggcca 


ttttccttca 


actgagggct caaaactcct 


5194 


ggacaagttg 


ctggctcctg 


agaccagtat 


ttcctggagm 


tgtgcctcag tgaaggggcc 


5254 


cagcctgagg 


aaccctggct 


cttttcttta 


aagcccaggc 


cccacttaca taaaacattt 


5314 


cagggtcact 


ggaaacagtg 


aagtgccatt 


tgtngaagcc 


tactgnatgc cagcccactg 


5374 


ctcatccacg 


tggtatgcca 


tgcctacgag 


gaagg'ccagc 


gcatgcagga ntggtctcta 


5434 


atgntgtggt 


cattgcacag 


aagggaaagg 


tctcaaggaa 


gagtcaactg ggacaagcac 


5494 


aagcccaccg 


gacatggcct 


tggtaaaggt 


tagcagactg 


gtgtgtgtgg atctgcagtg 


5554 


cttcactgga 


aataatttat 


tcattgcaga 


tactttttag 


gtggcatttt attcatttcc 


5614 


tgtgctttaa 


ataaacaaat 


gtaccaaaaa 


acaagtatca 


agctgtttaa gtgcttcggc 


5674 


tacttgtccc 


ctggttcagt 


agaggccccg 


gtttcccagt 


tgttgactgt gacaggctca 


5734 
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gcatgggctc agcagatgct gtcttaattt gtggatgata cagaaagcca ggctttggga 5794 
tacaagttct ttcctcttca tttgatgccg tgcactgtgt gaagcagatg tttttgtccg 5854 
gaaataaaaa taatagtctt ggagtctcgc caaaaaaaaa aag 5 897 



<210> 2 
<211> 749 
<212> PRT 

<213> Homo sapiens 
<40C - 2 

Met .Leu Ser lie Lys Ser Gly Glu Arg lie Val Phe Thr Phe Ser Cys 
1 5 10 15 

Gin Ser Pro Glu Asn His Phe Val lie Glu lie Gin Lys Asn lie Asp 
20 25 30 

Cys Met Ser Gly Pro Cys Pro Phe Gly Glu Val Gin Leu Gin Pro Ser 
3 5 40 45 

Thr Ser Leu Leu Pro Thr Leu Asn Arg Thr Phe lie Trp Asp Val Lys 
50 55 60 

Ala His Lys Ser lie Gly Leu Glu Leu Gin Phe Ser He Pro Arg Leu 
65 70 75 80 

Arg Gin He Gly Pro Gly Glu Ser Cys Pro Asp Gly Val Thr His Ser 
85 90 95 

He Ser Gly Arg He Asp Ala Thr Val Val Arg He Gly Thr Phe Cys 
100 105 110 

Ser Asn Gly Thr Val Ser Arg lie Lys Met Gin Glu Gly Val Lys Met 
115 120 125 

Ala Leu His Leu Pro Trp Phe His Pro Arg Asn Val Ser Gly Phe Ser 
130 135 140 

He Ala Asn Arg Ser Ser He Lys Arg Leu Cys He He Glu Ser Val 
145 150 155 160 

Phe Glu Gly Glu Gly Ser Ala Thr Leu Met Ser Ala Asn Tyr Pro Glu 
165 170 175 

Gly Phe Pro Glu Asp Glu Leu Met Thr Trp Gin Phe Val Val Pro Ala 
180 185 190 

His Leu Arg Ala Ser Val Ser Phe Leu Asn Phe Asn Leu Ser Asn Cys 
195 200 205 

Glu Arg Lys Glu Glu Arg Val Glu Tyr Tyr lie Pro Gly Ser Thr Thr 
210 215 220 

Asn Pro Glu Val Phe Lys Leu Glu Asp Lys Gin Pro Gly Asn Met Ala 
225 230 235 240 
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Gly Asn Phe Asn Leu Ser Leu Gin Gly Cys Asp Gin Asp Ala Gin Ser 
245 250 255 

Pro Gly He Leu Arg Leu Gin Phe Gin Val Leu Val Gin His Pro Gin 
260 265 270 

Asn Glu Ser Asn Lys He Tyr Val Val Asp Leu Ser Asn Glu Arg Ala 
275 280 285 

Met Ser Leu Thr He Glu Pro Arg Pro Val Lys Gin Ser Arg Lys Phe 
290 295 300 

Val Pro Gly Cys Phe Val Cys Leu Glu Ser Arg Thr Cys Ser Ser Asn 
305 310 315 320 

Leu Thr Leu Thr Ser Gly Ser Lys His Lys He Ser Phe Leu Cys Asp 
325 330 335 

Asp Leu Thr Arg Leu Trp Met Asn Val Glu Lys Thr He Ser Cys Thr 
340 345 350 

Asp His Arg Tyr Cys Gin Arg Lys Ser Tyr Ser Leu Gin Val Pro Ser 
355 360 365 

Asp He Leu His Leu Pro Val Glu Leu His Asp Phe Ser Trp Lys Leu 
370 375 380 

Leu Val Pro Lys Asp Arg Leu Ser Leu Val Leu Val Pro Ala Gin Lys 
385 390 395 400 

Leu Gin Gin His Thr His Glu Lys Pro Cys Asn Thr Ser Phe Ser Tyr 
405 410 415 

Leu Val Ala Ser Ala He Pro Ser Gin Asp Leu Tyr Phe Gly Ser Phe 
420 425 430 

Cys Pro Gly Gly Ser He Lys Gin He Gin Val Lys Gin Asn He Ser 
435 440 445 

Val Thr Leu Arg Thr Phe Ala Pro Ser Phe Gin Gin Glu Ala Ser Arg 
450 455 460 

Gin Gly Leu Thr Val Ser Phe He Pro Tyr Phe Lys Glu Glu Gly Val 
465 470 475 480 

Phe Thr Val Thr Pro Asp Thr Lys Ser Lys Val Tyr Leu Arg Thr Pro 
485 490 495 

Asn Trp Asp Arg Gly Leu Pro Ser Leu Thr Ser Val Ser Trp Asn He 
500 505 510 

Ser Val Pro Arg Asp Gin Val Ala Cys Leu Thr Phe Phe Lys Glu Arg 
515 520 525 



Ser Gly Val Val Cys Gin Thr Gly Arg Ala Phe Met He He Gin Glu 
530 535 540 
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Gin Arg Thr Arg Ala Glu Glu lie Phe Ser Leu Asp Glu Asp Val Leu 
545 " 550 555 560 

Pro Lys Pro Ser Phe His His His Ser Phe Trp Val Asn lie Ser Asn 
565 570 575 

Cys Ser Pro Thr Ser Gly Lys Gin Leu Asp Leu Leu Phe Ser Val Thr 
580 585 590 

Leu Thr Pro Arg Thr Val Asp Leu Thr Val lie Leu He Ala Ala Val 
595 600 605 

Gly Gly Gly Val Leu Leu Leu Ser Ala Leu Gly Leu He He Cys Cys 
610 615 620 

Val Lys Lys Lys Lys Lys Lys Thr Asn Lys Gly Pro Ala Val Gly He 
625 630 635 640 

Tyr Asn Gly Asn lie Asn Thr Glu Met Pro Gly Ser Gin Lys Ser Phe 
645 650 655 

Arg Lys Gly Glu Arg Thr Met Thr Pro Met Cys Met Gin Ser Ser Arg 
660 665 670 

Thr Pro Trp Tyr Met Gly He Cys Tyr Arg He Pro Ala Ala Pro Ser 
675 680 685 

Cys Ser Gin Arg Trp Thr Pro Thr Gly Arg Ser Arg Ala Pro Trp Gly 
690 695 700 

Ser Val Leu Pro Pro His Pro Pro Tyr Ala Pro Gly Pro Gin Leu Gin 
705 710 715 720 

Ser Trp Pro Leu Arg Ser His Leu Leu Ala Pro Leu Leu Ser Leu Arg 
725 730 , 735 

Val Asn Arg Thr Pro Ser Pro He Pro Thr Met Gly Met 
740 745 



<210> 3 
<211> 6163 
<212> DNA 

<213> Homo sapiens 
<220> 

<221> 5'UTR 
<222> (1) . . (282) 

<220> 

<221> GCjsignal 
<222> (147) . . (157) 

<220> 

<221> misc_feature 
<222> (201) . . (209) 

<223> cap signal; Transkript ions start 
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<220> 

<221> 3'UTR 

<222> (2794) . . (6163) 

<220> 

<221> 3'UTR 

<222> (2794) . . (6163) 

<220> 
<221> CDS 

<222> (283) . . (2793) 
<400> 3 

ccaacgccgc aatggggagt agtagggacc cagcaacccg gtgccgggag ccctgcaccc 60 

tgggagggag aggcggtcgc tgaggcagga agaggaggag gagagagagg agggacgcac 120 

cgggtcagct cgcgatcctg ctgcgcaggg cggggctcgg gccggtccgc ccgcgcgcag 180 

gtgagtgagc cagggcggag cgcagctgcg ccgggcttgg gcgcctgggg ccgccgctcc 240 

ccaccgtcgt tttccccacc gaggccgagg cgtcccggag tc atg gcc ggc ctg 294 

Met Ala Gly Leu 
1 

aac tgc ggg gtc tct ate gca ctg eta ggg gtt ctg ctg ctg ggt gcg 342 
Asn Cys Gly Val Ser lie Ala Leu Leu Gly Val Leu Leu Leu Gly Ala 
5 10 15 20 

gcg cgc ctg ccg cgc ggg gca gaa get ttt gag att get ctg cca cga 390 
Ala Arg Leu Pro Arg Gly Ala Glu Ala Phe Glu He Ala Leu Pro Arg 
25 30 35 

gaa age aac att aca gtt etc ata aag ctg ggg ace ccg act ctg ctg 438 
Glu Ser Asn He Thr Val Leu He Lys Leu Gly Thr Pro Thr Leu Leu 
40 45 50 

gca aaa ccc tgt tac ate gtc att tct aaa aga cat ata ace atg ttg 4 86 
Ala Lys Pro Cys Tyr He Val He Ser Lys Arg His He Thr Met Leu 
55 60 65 

tec ate aag tct gga gaa aga ata gtc ttt ace ttt age tgc cag agt 534 
Ser He Lys Ser Gly Glu Arg He Val Phe Thr Phe Ser Cys Gin Ser 
70 75 80 

cct gag aat cac ttt gtc ata gag ate cag aaa aat att gac tgt atg 582 
Pro Glu Asn His Phe Val He Glu He Gin Lys Asn He Asp Cys Met 
85 90 95 100 

tea ggc cca tgt cct ttt ggg gag gtt cag ctt cag ccc teg aca teg 630 
Ser Gly Pro Cys Pro Phe Gly Glu Val Gin Leu Gin Pro Ser Thr Ser 
105 110 115 

ttg ttg cct ace etc aac aga act ttc ate tgg gat gtc aaa get cat 678 
Leu Leu Pro Thr Leu Asn Arg Thr Phe lie Trp Asp Val Lys Ala His 
120 125 130 
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aag age ate ggt tta gag ctg cag ttt tec ate cct cgc ctg agg cag 726 
Lys Ser He Gly Leu Glu Leu Gin Phe Ser He Pro Arg Leu Arg Gin 
135 ' 140 145 

ate ggt ccg ggt gag age tgc cca gac gga gtc act cac tec ate age 774 
He Gly Pro Gly Glu Ser Cys Pro Asp Gly Val Thr Kis Ser He Ser 
150 155 160 

ggc cga ate gat gee ace gtg gtc agg ate gga acc ttc tgc age aat 
Gly Arg He Asp Ala Thr Val Val Arg He Gly Thr Phe Cys Ser Asn 
165 " 170 175 180 



822 



ggc act gtg tec egg ate aag atg caa gaa gga gtg aaa atg gee tta 870 
Gly Thr Val Ser Arg He Lys Met Gin Glu Gly Val Lys Met Ala Leu 
185 190 195 



cac etc cca tgg ttc cac ccc aga aat gtc tec ggc ttc age att gca 
His Leu Pro Trp Phe His Pro Arg Asn Val Ser Gly Phe Ser He Ala 



918 



200 



205 210 



aac cgc tea tct ata aaa cgt ctg tgc ate ate gag tct gtg ttt gag 966 
Asn Arg Ser Ser He Lys Arg Leu Cys He He Glu Ser Val Phe Glu 
215 220 225 

ggt gaa ggc tea gca acc ctg atg tct gee aac tac cca gaa ggc ttc 
Gly Glu Gly Ser Ala Thr Leu Met Ser Ala Asn Tyr Pro Glu Gly Phe 
230 235 240 

cct gag gat gag etc atg acg tgg cag ttt gtc gtt cct gca cac ctg 
Pro Glu Asp Glu Leu Met Thr Trp Gin Phe Val Val Pro Ala Hxs Leu 
250 255 260 



1014 



1062 



245 



1110 



egg gee age gtc tec ttc etc aac ttc aac etc tec aac tgt gag agg 
Arg Ala Ser Val Ser Phe Leu Asn Phe Asn Leu Ser Asn Cys Glu Arg 
265 270 275 

aag gag gag egg gtt gaa tac tac ate ccg ggc tec acc acc aac ccc 1158 
Lys Glu Glu Arg Val Glu Tyr Tyr He Pro Gly Ser Thr Thr Asn Pro 
280 285 290 

gag gtg ttc aag ctg gag gac aag cag cct ggg aac atg gcg ggg aac 1206 
Glu Val Phe Lys Leu Glu Asp Lys Gin Pro Gly Asn Met Ala Gly Asn 
295 300 305 

ttc aac etc tct ctg caa ggc tgt gac caa gat gee caa agt cca ggg 1254 
Phe Asn Leu Ser Leu Gin Gly Cys Asp Gin Asp Ala Gin Ser Pro Gly 
310 315 320 

ate etc egg ctg cag ttc caa gtt ttg gtc caa cat cca caa aat gaa 
He Leu Arg Leu Gin Phe Gin Val Leu Val Gin His Pro Gin Asn Glu 



1302 



325 



330 335 340 



age aat aaa ate tac gtg gtt gac ttg agt aat gag cga gee atg tea 
Ser Asn Lys He Tyr Val Val Asp Leu Ser Asn Glu Arg Ala Met Ser 
345 350 355 



1350 
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etc acc ate gag cca egg ccc gtc aaa cag age cgc aag ttt gtc cct 1398 

Leu Thr lie Glu Pro Arg Pro Val Lys Gin Ser Arg Lys Phe Val Pro 

360 365 370 

ggc tgt ttc gtg tgt eta gaa tct egg acc tgc agt age aac etc acc 1446 

Gly Cys Phe Val Cys Leu Glu Ser Arg Thr Cys Ser Ser Asn Leu Thr 
375 380 385 

ctg aca tct ggc tec aaa cac aaa ate tec ttc ctt tgt gat gat ctg 1494 

Leu Thr Ser Gly Ser Lys His Lys lie Ser Phe Leu Cys Asp Asp Leu 
390 395 400 

aca cgt ctg tgg atg aat gtg gaa aaa acc ata age tgc aca gac cac 1542 

Thr Arg Leu Trp Met Asn Val Glu Lys Thr lie Ser Cys Thr Asp His 
405 410 415 420 

egg tac tgc caa agg aaa tec tac tea etc cag gtg ccc agt gac ate 1590 

Arg Tyr Cys Gin Arg Lys Ser Tyr Ser Leu Gin Val Pro Ser Asp lie 
425 430 435 

etc cac ctg cct gtg gag ctg cat gac ttc tec tgg aag ctg ctg gtg 163 8 

Leu His Leu Pro Val Glu Leu His Asp Phe Ser Trp Lys Leu Leu Val 

440 445 450 

ccc aag gac agg etc age ctg gtg ctg gtg cca gee cag aag ctg cag 1686 

Pro Lys Asp Arg Leu Ser Leu Val Leu Val Pro Ala Gin Lys Leu Gin 
455 460 465 

cag cat aca cac gag aag ccc tgc aac acc age ttc age tac etc gtg 1734 

Gin His Thr His Glu Lys Pro Cys Asn Thr Ser Phe Ser Tyr Leu Val 
470 475 480 

gee agt gee ata ccc age cag gac ctg tac ttc ggc tec ttc tgc ccg 1782 

Ala Ser Ala He Pro Ser Gin Asp Leu Tyr Phe Gly Ser Phe Cys Pro 
485 490 495 500 

gga ggc tct ate aag cag ate cag gtg aag cag aac ate teg gtg acc 183 0 

Gly Gly Ser He Lys Gin He Gin Val Lys Gin Asn He Ser Val Thr 
505 510 515 

ctt cgc acc ttt gee ccc age ttc caa caa gag gee tec agg cag ggt 1878 

Leu Arg Thr Phe Ala Pro Ser Phe Gin Gin Glu Ala Ser Arg Gin Gly 

520 525 530 

ctg acg gtg tec ttt ata cct tat ttc aaa gag gaa ggc gtt ttc acg 1926 

Leu Thr Val Ser Phe He Pro Tyr Phe Lys Glu Glu Gly Val Phe Thr 
535 540 545 

gtg acc cct gac aca aaa age aag gtc tac ctg agg acc ccc aac tgg 1974 

Val Thr Pro Asp Thr Lys Ser Lys Val Tyr Leu Arg Thr Pro Asn Trp 
550 555 560 

gac egg ggc ctg cca tec etc acc tct gtg tec tgg aac ate age gtg 2 022 

Asp Arg Gly Leu Pro Ser Leu Thr Ser Val Ser Trp Asn He Ser Val 
565 570 575 580 
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ccc aga gac cag gtg gcc tgc ctg act ttc ttt aag gag egg age ggc 
Pro Arg Asp Gin Val Ala Cys Leu Thr Phe Phe Lys Glu Arg Ser Gly 
585 590 595 



2070 



gtg gtc tgc cag aca ggg cgc gca ttc atg ate ate cag gag cag egg 2118 
Val Val Cys Gin Thr Gly Arg Ala Phe Met He He Gin Glu Gin Arg 
600 605 610 

acc egg get gag gag ate ttc age ctg gac gag gat gtg etc ccc aag 2166 
Thr Arg Ala Glu Glu He Phe Ser Leu Asp Glu Asp Val Leu Pro Lys 
615 620 625 

cca age ttc cac cat cac age ttc tgg gtc aac ate tct aac tgc age 2214 
Pro Ser Phe His His His Ser Phe Trp Val Asn He Ser Asn Cys Ser 
630 635 640 

ccc acg age ggc aag cag eta gac ctg etc ttc teg gtg aca ctt acc 2262 
Pro Thr Ser Gly Lys Gin Leu Asp Leu Leu Phe Ser Val Thr Leu Thr 
645 650 655 660 

cca agg act gtg gac ttg act gtc ate etc ate gca gcg gtg gga ggt 2310 
Pro Arg Thr Val Asp Leu Thr Val He Leu He Ala Ala Val Gly Gly 
665 670 675 

gga gtc tta ctg ctg tct gcc etc ggg etc ate att tgc tgt gtg aaa 2358 
Gly Val Leu Leu Leu Ser Ala Leu Gly Leu He He Cys Cys Val Lys 
680 685 690 



aag aag aaa aag aag aca aac aag ggc ccc get gtg ggt ate tac aat 
Lys Lys Lys Lys Lys Thr Asn Lys Gly Pro Ala Val Gly He Tyr Asn 
695 700 705 



atg gta tat ggg cat ctg eta cag gat tec age ggc tec ttc ctg cag 
Met Val Tyr Gly His Leu Leu Gin Asp Ser Ser Gly Ser Phe Leu Gin 
745 750 755 



2406 



ggc aac ate aat act gag atg ccg agg cag cca aaa aag ttt cag aaa 2454 
Gly Asn He Asn Thr Glu Met Pro Arg Gin Pro Lys Lys Phe Gin Lys 
710 715 720 

ggg C ga aag gac aat gac tec cat gtg tat gca gtc ate gag gac acc 2502 
Gly Arg Lys Asp Asn Asp Ser His Val Tyr Ala Val He Glu Asp Thr 
725 730 735 740 



2550 



cca gag gtg gac acc tac egg ccg ttc cag ggc acc atg ggg gtc tgt 2598 
Pro Glu Val Asp Thr Tyr Arg Pro Phe Gin Gly Thr Met Gly Val Cys 
760 765 770 

cct ccc tec cca ccc acc ata tgc tec agg gcc cca act gca aag ttg 2646 
Pro Pro Ser Pro Pro Thr He Cys Ser Arg Ala Pro Thr Ala Lys Leu 
775 780 785 

gcc act gag gag cca cct cct cgc tec cct cct gag tct gag agt gaa 2694 
Ala Thr Glu Glu Pro Pro Pro Arg Ser Pro Pro Glu Ser Glu Ser Glu 
790 795 800 
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ccg tac ace ttc tec cat ccc aac aat ggg gat gta age age aag gac 2742 

Pro Tyr Thr Phe Ser His Pro Asn Asn Gly Asp Val Ser Ser Lys Asp 

805 810 815 820 

aca gac att ccc tta ctg aac act cag gag ccc atg gag cca gca gaa 2 790 

Thr Asp lie Pro Leu Leu Asn Thr Gin Glu Pro Met Glu Pro Ala Glu 
825 830 835 

taa cttgatccat tccagacgct ttgctgagtt tcataaagca gggcactgag 2843 



acacccgtcc 


gtgttcctaa 


ccagaaatcc 


taaagaagag 


gaattataca 


gaaggaacag 


2903 


caggaggttt 


tcctggacac 


cgccaacttc 


acattgetea 


gtggactcat 


tctaagggca 


2963 


agacattgaa 


aatgatgaat 


tccaatctgg 


atacagtcat 


gacagctcat 


gtgctcctca 


3023 


acttaggctg 


tgcggttagc 


cagcctgtaa 


tgagaggaga 


gaggectgag 


tcacctagca 


3083 


tagggttgea 


gcaagccctg 


gattcagagt 


gttaaacaga 


ggcttgccct 


cttcaggaca 


3143 


acagttccaa 


ttccaaggag 


cctacctgag 


gtccctactc 


tcactggggt 


ccccaggatg. 


3203 


aaaacgacaa 


tgtgcctttt 


tattattatt 


tatttggtgg 


tcctgtgtta 


tttaagagat 


3263 


caaatgtata 


accacctagc 


tcttttcacc 


tgacttagta 


ataactcata 


ctaactggtt 


3323 


tggatgcctg 


ggttgtgact 


tctactgacc 


gctagataaa 


cgtgtgcctg 


tcccccaggt 


3383 


ggtgggaata 


atttacaatc 


tgtccaacca 


gaaaagaatg 


tgtgtgtttg 


agcagcattg 


3443 


acacatatct 


gctttgataa 


gagacttcct 


gattctctag 


gtcggttcgt 


ggttatccca 


3503 


ttgtggaaat 


tcatcttgaa 


tcccattgtc 


ctatagtcct 


agcaataaga 


gaaatttcct 


3563 


caagtttcca 


tgtgcggttc 


tcctagctgc 


agcaatactt 


tgacatttaa 


agagaaattt 


3623 


agagaatatt 


ctcatcctct 


aaaaatgttt 


aaatatatac 


caaacagtgg 


ccccctgcat 


3683 


tagttttctg 


ttgccactgc 


aacccattac 


ttggtagctt 


aaaaacaaca 


cattagctta 


3743 


tagtcctggg 


gatcagaatt 


ccaaaatgga 


tgtcoctgaa 


tgaaaatcaa 


ggtgtcagca 


3803 


gagctgtgct 


ccttctgaag 


gctctaggga 


gaagccggtt 


ccttgccatt 


tcaagcttct 


3863 


agaggctggc 


tgcattccca 


ggctccagtg 


gctggtcaag 


cttttctcac 


atggcatcac 


3923 


tgtgacactg 


gccctcccac 


ttccctcttt 


gacttacaaa 


gcccaccagg 


aagatccagg 


3983 


ataatctctc 


catctaaaga 


tccttcatca 


tcctggaaga 


gccttttgcc 


atgeaagaca 


4043 


acatagccac 


aggtggggat 


taggaccagg 


acatctttgg 


ggtgctgtta 


ttctgcctac 


4103 


cacaccttcc 


tgccactgac 


tcccacagga 


gaggctacaa 


aatgatctgg 


cgcacaggga 


4163 


tgttttgttt 


agettgegga 


ctctaacact 


taaaaaaacc 


ccagatcaga 


agate tggee 


4223 


atgctggggc 


tcacattctc 


acctagcaac 


aactggctgg 


agctgggcac 


cagctctgcc 


4283 
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tttagaaggg gtgtccactt caccaggtca ccacagccca cactacgccc tatcacttcc 4343 
cacaatgagg ctaagtgttt gtttctactg atcaatgccc ctgcaggttg catttattgt 4403 
aatgaaaaag aaagactggg attaatctct aatcaggtga gtagaccatg agaccaatgt 4463 
gtgctcacat tacccttttt cttttttttc tttttctttt tctttttttt tttaatgtga 4523 
gacaggatct cattctgttg cctaggctgg agtgcagtgg cgcaatctcg gctcactgca 4583 
acctctgcct cctgggctca agcaattctc ccacctcagc ctcccaaata gctgggatca 4643 
ctggcacaaa ccaccatgcc cagctaattt tgtatttttt gtagagacag ggtttcacca 4703 
tgttgcccag gctggtctca acctcctggg ctcaagcaat cctcctgcct cggcctccca 4763 
aagtgctggg attacagatg tgagccaccg catccagccc cacaccctca tttataccaa 4 823 
ttacctgccc agtaactgtg gacttttgct tcctcacccc tgctctgatc tggaaggaga 4883 
gggattatgt tatagcttgt cagcacagtc ccaagttcaa tatttctgcg gcaaaaactt 4943 
ccttcaaaaa ataaatgtac ttcattgtat tcaatgaatt caccttggaa atgcaccgcc 5003 
tcaacttgtt cacatggcat aaatgaaagg aattttatag tctcctaaat ggcgtgtact 5063 
gcaagacctc ttgaacactt tccagaggat aggatattta agtcatgccc ttggcgttgc 5123 
ctatggcacc tttcccttct gaaagtctgg ttcctgccca gtgacccttg gccttgtgag 5183 
ccgagatgct gaccctgcat aaagggccaa aggagggctg cggcttcctt ccctcactga 5243 
agagccctta tttgaattca ctgtgtggag ccctagccct ccattctcga cattccccaa 53 03 
cctcccagcc ccttccaagc aggactaggt gccctgcatt ccacccaagg tgggattggc 5363 
cttccttagg ctggctactt gtcaccatca ccgacatcac tgttgcctgc aaggacacca 5423 
cgtggccatt ttccttcaac tgagggctca aaactcctgg acaagttgct ggctcctgag 5483 
accagtattt cctggagctg tgcctcagtg aaggggccca gcctgaggaa ccctggctct 5543 
tttctttaaa gcccaggccc cacttacata aaacatttca gggtcactgg aaacagtgaa 5603 
gtgccatttg ttgaagccta ctgcatgcca gcccactgct catccacgtg gtctgccatg 5663 
cctacgagga aggccagcgc atgcaggact ggtctctaat gctgtggtca ttgcacagaa 5723 
gggaaaggtc tcaaggaaga gtcaactggg acaagcacaa gcccaccgga catggccttg 5783 
gtaaaggtta gcagactggt gtgtgtggat ctgcagtgct tcactggaaa taatttattc 5843 
attgcagata ctttttaggt ggcattttat tcatttcctg tgctttaaat aaacaaatgt 5903 
accaaaaaac aagtatcaag ctgtttaagt gcttcggcta cttgtcccct ggttcagtag 5963 
aggccccggt ttcccagttg ttgactgtga caggctcagc atgggctcag cagatgctgt 6023 
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cttaatttgt ggatgataca gaaagccagg ctttgggata caagttcttt cctcttcatt 6083 
tgatgccgtg cactgtgtga agcagatgtt tttgtccgga aataaaaata atagtcttgg 6143 
agtctcgcca aaaaaaaaaa 6163 



<210> 4 
<211> 836 
<212> PRT 

<213> Homo sapiens 
<400> 4 

Met Ala Gly Leu Asn Cys Gly Val Ser He Ala Leu Leu Gly Val Leu 
15 10 15 

Leu Leu Gly Ala Ala Arg Leu Pro Arg Gly Ala Glu Ala Phe Glu He 
20 25 30 

Ala Leu Pro Arg Glu Ser Asn He Thr Val Leu He Lys Leu Gly Thr 
35 40 45 

Pro Thr Leu Leu Ala Lys Pro Cys Tyr He Val He Ser Lys Arg His 
50 55 60 

He Thr Met Leu Ser He Lys Ser Gly Glu Arg He Val Phe Thr Phe 
65 70 75 80 

Ser Cys Gin Ser Pro Glu Asn His Phe Val He Glu He Gin Lys Asn 
85 90 95 

He Asp Cys Met Ser Gly Pro Cys Pro Phe Gly Glu Val Gin Leu Gin 
100 105 110 

Pro Ser Thr Ser Leu Leu Pro Thr Leu Asn Arg Thr Phe He Trp Asp 
115 120 125 

Val Lys Ala His Lys Ser He Gly Leu Glu Leu Gin Phe Ser He Pro 
130 135 140 

Arg Leu Arg Gin He Gly Pro Gly Glu Ser Cys Pro Asp Gly Val Thr 
145 150 155 160 

His Ser He Ser Gly Arg He Asp Ala Thr Val Val Arg He Gly Thr 
165 170 175 

Phe Cys Ser Asn Gly Thr Val Ser Arg He Lys Met Gin Glu Gly Val 
180 185 190 

Lys Met Ala Leu His Leu Pro Trp Phe His Pro Arg Asn Val Ser Gly 
195 200 205 



Phe Ser He Ala Asn Arg Ser Ser He Lys Arg Leu Cys He He Glu 
210 215 220 
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Ser Val Phe Glu Gly Glu Gly Ser Ala Thr Leu Met Ser Ala Asn Tyr 
225 230 235 240 

Pro Glu Gly Phe Pro Glu Asp Glu Leu Met Thr Trp Gin Phe Val Val 
245 250 255 

Pro Ala His Leu Arg Ala Ser Val Ser Phe Leu Asn Phe Asn Leu Ser 
260 265 270 

Asn Cys Glu Arg Lys Glu Glu Arg Val Glu Tyr Tyr He Pro Gly Ser 
275 280 285 

Thr Thr Asn Pro Glu Val Phe Lys Leu Glu Asp Lys Gin Pro Gly Asn 
290 295 300 

Met Ala Gly Asn Phe Asn Leu Ser Leu Gin Gly Cys Asp Gin Asp Ala 
305 310 315 320 

Gin Ser Pro Gly He Leu Arg Leu Gin Phe Gin Val Leu Val Gin His 
325 330 335 

Pro Gin Asn Glu Ser Asn Lys He Tyr Val Val Asp Leu Ser Asn Glu 
340 345 350 

Arg Ala Met Ser Leu Thr He Glu Pro Arg Pro Val Lys Gin Ser Arg 
355 360 365 

Lys Phe Val Pro Gly Cys. Phe Val Cys Leu Glu Ser Arg Thr. Cys Ser 
370 375 380 

Ser Asn Leu Thr Leu Thr Ser Gly Ser Lys His Lys He Ser Phe Leu 
385 390 395 400 

Cys Asp Asp Leu Thr Arg Leu Trp Met Asn Val Glu Lys Thr He Ser 
405 410 415 

Cys Thr Asp His Arg Tyr Cys Gin Arg Lys Ser Tyr Ser Leu Gin Val 
420 425 430 

Pro^ Ser Asp lie Leu His Leu Pro Val Glu Leu His Asp Phe Ser Trp 
435 440 445 

Lys Leu Leu Val Pro Lys Asp Arg Leu Ser Leu Val Leu Val Pro Ala 
450 455 460 

Gin Lys Leu Gin Gin His Thr His Glu Lys Pro Cys Asn Thr Ser Phe 
465 470 475 480 

Ser Tyr Leu Val Ala Ser Ala He Pro Ser Gin Asp Leu Tyr Phe Gly 
485 490 495 

Ser Phe Cys Pro Gly Gly Ser He Lys Gin He Gin Val Lys Gin Asn 
500 505 510 

He Ser Val Thr Leu Arg Thr Phe Ala Pro Ser Phe Gin Gin Glu Ala 
515 520 525 
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Ser Arg Gin Gly Leu Thr Val Ser Phe lie Pro Tyr Phe Lys Glu Glu 
530 535 540 

Gly Val Phe Thr Val Thr Pro Asp Thr Lys Ser Lys Val Tyr Leu Arg 
545 550 555 560 

Thr Pro Asn Trp Asp Arg Gly Leu Pro Ser Leu Thr Ser Val Ser Trp 
565 . 570 575 

Asn lie Ser Val Pro Arg Asp Gin Val Ala Cys Leu Thr Phe Phe Lys 
580 585 590 

Glu Arg Ser Gly Val Val Cys Gin Thr Gly Arg Ala Phe Met He He 
595 600 605 

Gin Glu Gin Arg Thr Arg Ala Glu Glu He Phe Ser Leu Asp Glu Asp 
610 615 620 

Val Leu Pro Lys Pro Ser Phe His His His Ser Phe Trp Val Asn He 
625 630 635 640 

Ser Asn Cys Ser Pro Thr Ser Gly Lys Gin Leu Asp Leu Leu Phe Ser 
645 650 655 

Val Thr Leu Thr Pro Arg Thr Val Asp Leu Thr Val lie Leu He Ala 
660 665 670 

Ala Val Gly Gly Gly Val Leu Leu Leu Ser Ala Leu Gly Leu He He 
675 680 685 

Cys Cys Val Lys Lys Lys Lys Lys Lys Thr Asn Lys Gly Pro Ala Val 
690 695 700 

Gly He Tyr Asn Gly Asn He Asn Thr Glu Met Pro Arg Gin Pro Lys 
705 710 715 720 

Lys Phe Gin Lys Gly Arg Lys Asp Asn Asp Ser His Val Tyr Ala Val 
725 730 735 

He Glu Asp Thr Met Val Tyr Gly His Leu Leu Gin Asp Ser Ser Gly 
740 745 750 

Ser Phe Leu Gin Pro Glu Val Asp Thr Tyr Arg Pro Phe Gin Gly Thr 
755 760 765 

Met Gly Val Cys Pro Pro Ser Pro Pro Thr He Cys Ser Arg Ala Pro 
770 775 780 

Thr Ala Lys Leu Ala Thr Glu Glu Pro Pro Pro Arg Ser Pro Pro Glu 
785 790 795 800 



Ser Glu Ser Glu Pro Tyr Thr Phe Ser His Pro Asn Asn Gly Asp Val 
805 810 815 



Ser Ser Lys Asp Thr Asp He Pro Leu Leu Asn Thr Gin Glu Pro Met 
820 825 830 
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Glu Pro Ala Glu 
835 



<210> 5 
<211> 23 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 
<400> 5 

accgcctcaa cttgttcaca tgg 



<210> 6 
<211> 26 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 
<400> 6 

ctggtctcag gagccagcaa cttgtc 



<210> 7 
<211> 25 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kanstlichen Sequenz: Prxmer 
<400> 7 

ctcatgacgt ggcagtttgt cgttc 



<210> 8 
<211> 26 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 
<400> 8 

ggctcgctca ttactcaagt caacca 
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<210> 9 

<211> 36 

<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 

<400> 9 

attcgcgact gatgatcgat tttttttttt tttttt 36 



<210> 10 

<211> 20 

<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 

<400> 10 

attcgcgact gatgatcgat 20 



<210> 11 
<211> 20 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 
<400> 11 

gagatattag aattctactc 20 



<210> 12 
<211> 17 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 
<400> 12 

gagtagaatt ctaatat 17 



<210> 13 

<211> 22 

<212> DNA 

<213> Kunstliche Sequenz 



<220> 
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<223> Beschreibung der kiinstlichen Sequenz: Primer 
<400> 13 

agtccatgtg aacaagttga gg 22 



<210> 14 
<211> 20 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: Primer 
<400> 14 

aattctccca cctcagcctc 20 



<210> 15 
<211> 22 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: Primer 
<400> 15 

aggatgaaaa cgacaatgtg cc 22 



<210> 16 
<211> 21 
<212> DNA 

<213> Kiinstliche Sequenz 

<220> , 
<223> Beschreibung der kunstlichen Sequenz: Primer 

<400> 16 

agaattgctt gagcccagga g 21 



<210> 17 
<211> 21 
<212> DNA 

<213> Ktinstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 



<400> 17 

caacttcaca ttgctcagtg g 



21 
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<210> 18 

<211> 25 

<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 

<400> 18 

tgagcaagtt cagcctggtt aagtc 25 



<210> 19 

<211> 26 

<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: Primer 



<210> 20 
<211> 26 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 
<400> 20 

tagacttcga gcaggagatg gccact 26 



<210> 21 
<211> 20 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 



<400> 19 

caccgaatac tcataaagaa ggtccc 



26 



<400> 21 

ccagccatgt acgtagccat 



20 



<210> 22 
<211> 19 
<212> DNA 



<213> Kiinstliche Sequenz 



<220> 
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<223> Beschreibung der kunstlichen Sequenz: Primer 
<400> 22 

ccaagaagga aggctggaa 



<210> 23 
<211> 25 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 
<400> 23 

ccatcaccat cttccaggag cgaga 



<210> 24 
<211> 19 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 
<400> 24 

ccaagaagga aggctggaa 



<210> 25 
<211> 20 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 
<400> 25 

tgcaggaggc attgctgatg 



<210> 26 
<211> 19 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 
<400> 26 

aaatcgtgca cttgcaggc 
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<210> 27 
<211> 18 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 
<400> 27 

ttgatgcgtt ccagctga 18 



<210> 28 
<211> 21 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 
<400> 28 

ttgaattcac tgtgtggagc c 21 



<210> 29 
<211> 19 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 
<400> 29 

tgcaggcaac agtgatgtc 19 



<210> 30 
<211> 24 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 
<400> 30 

attggccttc cttaggctgg ctac 24 



<210> 31 
<211> 43 
<212> DNA 

<213> Kunstliche Sequenz 



<220> 
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<223> Beschreibung der kiinstlichen Sequenz: Primer 
<400> 31 

tgtagcgtga agacgacaga aagggcgtgg taccgagctc gag 



<210> 32 
<211> 22 
<212> DNA 

<213> Kiinstliche Sequenz 



<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 
<400> 32 

agggcgtggt accgagctcg ag 



<210> 33 
<211> 11 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 



<400> 33 
ggctcgagct c 



<210> 34 
<211> 22 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 
<4O0> 34 

ggccatgtcc ggtgggcttg tg 



<210> 35 
<211> 26 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 



<400> 35 

ctcaaaactc ctggacaagt tgctgg 
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<210> 36 
<211> 22 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 
<400> 36 

aaggtgaagg tcggagtcaa eg 22 



<210> 37 
<211> 24 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 
<400> 37 

ggcagagatg atgacccttt tggc 24 



<210> 38 

<211> 23 

<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<221> 5»UTR 

<222> (1) . . (282) 

<220> 

<221> GC_signal 
<222> (147) . . (157) 

<220> 

<221> mis cofeature 
<222> (201) . . (209) 

<223> cap signal; Transkriptionsstart 
<220> 

<221> 3 1 XJTR 

<222> (2794) . . (6163) 

<220> 

<221> 3 ! UTR 

<222> (2794) . . (6163) 

<220> 
<221> CDS 

<222> (283) . . (2793) 



<400> 38 

agcagcagaa cccctagcag tgc 



23 
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<210> 39 
<211> 26 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 
<400> 39 

agaaccccta gcagtgcgat agagac 



<210> 40 
<211> 27 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 



<400> 40 

gaactgtaat gttgctttct cgtggca 
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